মূল বিষয়বস্তুতে যান

ডিক্টেশন কীভাবে কাজ করে

TalkWriter আপনার কণ্ঠকে একটি মাল্টি-স্টেজ পাইপলাইনের মাধ্যমে পরিষ্কার, ব্যবহারযোগ্য টেক্সটে রূপান্তরিত করে। এই পেজে Fn কী চাপা এবং টেক্সট দেখা — এর মাঝে ঠিক কী হয় তা ব্যাখ্যা করা হয়েছে।


ডিক্টেশন পাইপলাইন

আপনি ডিক্টেট করলে আপনার কণ্ঠ চারটি স্তরের মধ্য দিয়ে যায়:

🎤 ভয়েস ইনপুট → 📝 Speech-to-Text → ✨ AI পলিশ → 📋 পেস্ট

প্রতিটি স্তর আগেরটির উপর ভিত্তি করে তৈরি। প্রতিটি ধাপে কী হয় তা এখানে দেওয়া হলো:


স্তর ১: ভয়েস ইনপুট

কী হয়: আপনার মাইক্রোফোন আপনার কণ্ঠ ক্যাপচার করে এবং TalkWriter রিয়েল টাইমে অডিও ডেটা ক্লাউডে স্ট্রিম করে।

  • আপনার Mac-এর বিল্ট-ইন মাইক্রোফোন, এক্সটার্নাল USB মাইক বা Bluetooth হেডসেট অডিও ক্যাপচার করে।
  • TalkWriter কথা বলার সাথে সাথে অডিও স্ট্রিম করে। শেষ হওয়া পর্যন্ত অপেক্ষা করে না।
  • পিল ওভারলে একটি অ্যানিমেটেড ওয়েভফর্ম দেখায় যা নিশ্চিত করে অডিও শনাক্ত হচ্ছে।
tip

সেরা ফলাফলের জন্য স্পষ্টভাবে কথা বলুন এবং মাইক্রোফোন মুখ থেকে ৬-১২ ইঞ্চি দূরে রাখুন। বিস্তারিত সেটআপ টিপসের জন্য মাইক্রোফোন সেরা অনুশীলন দেখুন।


স্তর ২: Speech-to-Text (Soniox STT)

কী হয়: একটি প্রফেশনাল-গ্রেড স্পিচ রিকগনিশন ইঞ্জিন (Soniox) আপনার অডিওকে কাঁচা টেক্সটে রূপান্তরিত করে।

  • Soniox কম লেটেন্সিতে রিয়েল টাইমে আপনার অডিও স্ট্রিম প্রসেস করে।
  • এটি ১০০+ ভাষা সমর্থন করে এবং উচ্চারণ, দ্রুত কথা ও টেকনিক্যাল শব্দভাণ্ডার সামলাতে পারে।
  • কাঁচা আউটপুট আনফরম্যাটেড: কোনো যতিচিহ্ন নেই, বড় হাতের সংশোধন নেই এবং ফিলার শব্দ অন্তর্ভুক্ত থাকে।

কাঁচা আউটপুটের উদাহরণ:

hey um i wanted to follow up on our meeting from yesterday i think the project timeline looks good but uh we might need to push the design review back a week


স্তর ৩: AI পলিশ

কী হয়: TalkWriter-এর AI ইঞ্জিন কাঁচা ট্রান্সক্রিপশন পরিষ্কার করে এবং স্বাভাবিক, সুবিন্যস্ত টেক্সট তৈরি করে।

AI পলিশ এই রূপান্তরগুলো করে:

রূপান্তরআগেপরে
ফিলার শব্দ সরানো"um", "uh", "like", "you know"সরানো হয়েছে
যতিচিহ্ন যোগ"hello how are you""Hello, how are you?"
বড় হাতের সংশোধন"i went to new york""I went to New York"
সংখ্যা ফরম্যাট"twenty five dollars""$25"
বাক্য গঠন পরিষ্কার"so basically the thing is that"সরাসরি বাক্যবিন্যাস

পরিষ্কার আউটপুটের উদাহরণ:

Hey, I wanted to follow up on our meeting from yesterday. I think the project timeline looks good, but we might need to push the design review back a week.

Pro ফিচার

TalkTone AI পলিশের পরে একটি অতিরিক্ত স্তর যোগ করে। Pro থাকলে আপনার টেক্সট নির্বাচিত লেখার স্টাইলে (Professional, Casual, Academic ইত্যাদি) পুনর্লিখিত হয়। এখনই আপগ্রেড করুন →


স্তর ৪: পেস্ট

কী হয়: পরিষ্কার টেক্সট সক্রিয় অ্যাপে আপনার কার্সর পজিশনে ঢোকানো হয়।

  • TalkWriter macOS Accessibility ব্যবহার করে একটি কীবোর্ড পেস্ট অ্যাকশন সিমুলেট করে।
  • আপনি ডিক্টেশন শুরু করার সময় কার্সর যেখানে ছিল সেখানে টেক্সট দেখায়।
  • পেস্ট নিশ্চিত করতে পিল ওভারলে সংক্ষিপ্তভাবে একটি চেকমার্ক দেখায়।

পাইপলাইন সারাংশ

স্তরইঞ্জিনকোথায় হয়গতি
ভয়েস ইনপুটআপনার মাইক্রোফোনআপনার Mac-এ স্থানীয়ভাবেতাৎক্ষণিক
Speech-to-TextSoniox (ক্লাউড)রিয়েল-টাইম স্ট্রিমিং~200ms লেটেন্সি
AI পলিশTalkWriter AI (ক্লাউড)কথা শেষ হওয়ার পরে~500ms-1s
পেস্টmacOS Accessibilityআপনার Mac-এ স্থানীয়ভাবেতাৎক্ষণিক
note

Fn কী ছাড়ার পর থেকে টেক্সট দেখা পর্যন্ত মোট সময়: সাধারণত ছোট ডিক্টেশনের জন্য ২ সেকেন্ডেরও কম। দীর্ঘ প্যাসেজে AI প্রসেসিংয়ের জন্য সামান্য বেশি সময় লাগতে পারে।


সচরাচর জিজ্ঞাসা

AI পলিশ বাদ দিয়ে কাঁচা ট্রান্সক্রিপশন পেতে পারি? হ্যাঁ। Settings > AI Polish-এ AI পলিশ বন্ধ করুন। আপনি সরাসরি আনফরম্যাটেড Soniox আউটপুট পাবেন।

আমার অডিও কি সার্ভারে সংরক্ষিত হয়? অডিও রিয়েল-টাইম প্রসেসিংয়ের জন্য স্ট্রিম করা হয় এবং স্থায়ীভাবে সংরক্ষণ করা হয় না। বিস্তারিত জানতে আমাদের প্রাইভেসি পলিসি দেখুন।

TalkWriter-এর ইন্টারনেট কেন দরকার? Speech-to-text ইঞ্জিন (Soniox) এবং AI পলিশ দুটোই ক্লাউডে চলে। সব ডিক্টেশনের জন্য ইন্টারনেট সংযোগ আবশ্যক।

ডিক্টেশনের মাঝে ইন্টারনেট চলে গেলে কী হয়? TalkWriter পিল ওভারলেতে একটি ত্রুটি দেখাবে। সংযোগ বিচ্ছিন্ন হওয়ার আগে ক্যাপচার করা অডিও এখনও প্রসেস হতে পারে, তবে ফলাফল নিশ্চিত নয়।


এটি কি সহায়ক ছিল? আমাদের জানান support@talkwriter.ai