मुख्य सामग्री पर जाएँ

डिक्टेशन कैसे काम करता है

TalkWriter आपकी आवाज़ को एक मल्टी-स्टेज पाइपलाइन के माध्यम से पॉलिश्ड, उपयोग के लिए तैयार टेक्स्ट में बदलता है। यह पेज हर चरण की व्याख्या करता है ताकि आप ठीक से समझ सकें कि Fn की दबाने और टेक्स्ट दिखने के बीच क्या होता है।


डिक्टेशन पाइपलाइन

जब आप डिक्टेट करते हैं, आपकी आवाज़ चार चरणों से गुज़रती है:

🎤 वॉइस इनपुट → 📝 Speech-to-Text → ✨ AI पॉलिश → 📋 पेस्ट

प्रत्येक चरण पिछले पर आधारित है। यहाँ हर चरण पर क्या होता है:


चरण 1: वॉइस इनपुट

क्या होता है: आपका माइक्रोफ़ोन आपकी आवाज़ कैप्चर करता है और TalkWriter रियल टाइम में ऑडियो डेटा को क्लाउड में स्ट्रीम करता है।

  • आपके Mac का बिल्ट-इन माइक्रोफ़ोन, बाहरी USB माइक, या Bluetooth हेडसेट ऑडियो कैप्चर करता है।
  • TalkWriter बोलते समय ऑडियो स्ट्रीम करता है। यह आपके पूरा बोलने का इंतज़ार नहीं करता।
  • पिल ओवरले एक एनिमेटेड वेवफ़ॉर्म दिखाता है जिससे पुष्टि होती है कि ऑडियो पकड़ा जा रहा है।
tip

सर्वोत्तम परिणामों के लिए, स्पष्ट बोलें और माइक्रोफ़ोन को मुँह से 6-12 इंच दूर रखें। विस्तृत सेटअप सुझावों के लिए माइक्रोफ़ोन सर्वोत्तम अभ्यास देखें।


चरण 2: Speech-to-Text (Soniox STT)

क्या होता है: एक प्रोफेशनल-ग्रेड स्पीच रिकग्निशन इंजन (Soniox) आपके ऑडियो को कच्चे टेक्स्ट में बदलता है।

  • Soniox आपकी ऑडियो स्ट्रीम को कम विलंबता के साथ रियल टाइम में प्रोसेस करता है।
  • यह 100+ भाषाओं का समर्थन करता है और उच्चारण, तेज़ बोली और तकनीकी शब्दावली संभाल सकता है।
  • कच्चा आउटपुट अनफ़ॉर्मेटेड होता है: कोई विराम चिह्न नहीं, कोई कैपिटलाइज़ेशन सुधार नहीं, और फिलर शब्द शामिल होते हैं।

चरण 3: AI पॉलिश

क्या होता है: TalkWriter का AI इंजन कच्चे ट्रांसक्रिप्शन को साफ करता है और स्वाभाविक, अच्छी तरह फ़ॉर्मेट किया टेक्स्ट बनाता है।

AI पॉलिश ये परिवर्तन करता है:

परिवर्तनपहलेबाद
फिलर शब्द हटाना"um", "uh", "like", "you know"हटाए गए
विराम चिह्न जोड़ना"hello how are you""Hello, how are you?"
कैपिटलाइज़ेशन ठीक करना"i went to new york""I went to New York"
संख्याएँ फ़ॉर्मेट करना"twenty five dollars""$25"
वाक्य संरचना साफ करना"so basically the thing is that"सीधी भाषा
Pro सुविधा

TalkTone AI पॉलिश के बाद एक अतिरिक्त परत जोड़ता है। यदि आपके पास Pro है, तो आपका टेक्स्ट चुनी गई राइटिंग स्टाइल (Professional, Casual, Academic आदि) में फिर से लिखा जाता है। अभी अपग्रेड करें →


चरण 4: पेस्ट

क्या होता है: पॉलिश्ड टेक्स्ट आपके कर्सर की स्थिति पर सक्रिय ऐप में डाला जाता है।

  • TalkWriter macOS Accessibility का उपयोग करके कीबोर्ड पेस्ट क्रिया अनुकरण करता है।
  • टेक्स्ट वहाँ दिखता है जहाँ डिक्टेशन शुरू करते समय आपका कर्सर था।
  • पिल ओवरले संक्षेप में चेकमार्क दिखाता है जो पेस्ट की पुष्टि करता है।

पाइपलाइन सारांश

चरणइंजनकहाँ होता हैगति
वॉइस इनपुटआपका माइक्रोफ़ोनआपके Mac पर स्थानीयतुरंत
Speech-to-TextSoniox (क्लाउड)रियल-टाइम स्ट्रीमिंग~200ms विलंबता
AI पॉलिशTalkWriter AI (क्लाउड)बोलने के बाद~500ms-1s
पेस्टmacOS Accessibilityआपके Mac पर स्थानीयतुरंत
note

Fn की छोड़ने से टेक्स्ट दिखने तक कुल समय: छोटे डिक्टेशन के लिए आमतौर पर 2 सेकंड से कम। लंबे अंशों में AI प्रोसेसिंग के लिए थोड़ा अधिक समय लग सकता है।


अक्सर पूछे जाने वाले प्रश्न

क्या मैं AI पॉलिश छोड़कर कच्चा ट्रांसक्रिप्शन पा सकता हूँ? हाँ। Settings > AI Polish में AI पॉलिश बंद करें। आपको सीधे अनफ़ॉर्मेटेड Soniox आउटपुट मिलेगा।

क्या मेरा ऑडियो सर्वर पर संग्रहित होता है? ऑडियो रियल-टाइम प्रोसेसिंग के लिए स्ट्रीम किया जाता है और स्थायी रूप से संग्रहित नहीं किया जाता। विवरण के लिए हमारी गोपनीयता नीति देखें।

TalkWriter को इंटरनेट क्यों चाहिए? Speech-to-text इंजन (Soniox) और AI पॉलिश दोनों क्लाउड में चलते हैं। सभी डिक्टेशन के लिए इंटरनेट कनेक्शन आवश्यक है।

अगर डिक्टेशन के बीच इंटरनेट कट जाए तो क्या होता है? TalkWriter पिल ओवरले पर त्रुटि संकेतक दिखाएगा। डिस्कनेक्शन से पहले कैप्चर किया ऑडियो आंशिक रूप से प्रोसेस हो सकता है, लेकिन परिणाम की गारंटी नहीं है।


क्या यह सहायक था? हमें बताएँ support@talkwriter.ai पर