কন্ঠ সনাক্তকরণ

উইকিপিডিয়া, মুক্ত বিশ্বকোষ থেকে
পরিভ্রমণে ঝাঁপ দিন অনুসন্ধানে ঝাঁপ দিন

কণ্ঠ শনাক্তকরণ হলো কম্পিউটেশনাল ভাষাবিদ্যার পারস্পরিক সম্পর্কযুক্ত একটি উপক্ষেত্র যেখানে কম্পিউটারের সাহায্যে কণ্ঠ শনাক্তকরণ ও মুখে উচ্চারিত ভাষাকে কম্পিউটারের সাহায্যে লেখ্যরুপে রুপান্তর সম্পর্কিত প্রযুক্তিসমূহ উন্নয়ন করে থাকে। কণ্ঠ শনাক্তকরণকে স্বয়ংক্রিয় কণ্ঠ শনাক্তকরণ, কম্পিউটার কণ্ঠ শনাক্তকরণ বা কণ্ঠ থেকে লেখ্যরুপে রুপান্তর (Speech to text (STT)) বলা হয়ে থাকে। ভাষাবিদ্যা, কম্পিউটার বিজ্ঞান ও ইলেক্ট্রিক্যাল প্রকৌশল এর ক্ষেত্রসমূহের জ্ঞান ও গবেষণার সমন্বিত রুপ হলো কণ্ঠ শনাক্তকরণ।

কিছু কণ্ঠ শনাক্তকরণ সিস্টেমে "প্রশিক্ষণ" প্রয়োজন হয়ে থাকে যেখানে একজন ব্যক্তি বা বক্তা কোন বাক্য পড়ে বা আলাদা আলাদা শব্দ পড়ে। সিস্টেম ব্যক্তির কণ্ঠ বিশ্লেষণ করে,বিশ্লেষিত বৈশিষ্ট্য ব্যবহার করে ভবিষ্যতে উক্ত ব্যক্তির কণ্ঠ শনাক্তকরণে ব্যবহার করে থাকে যা শনাক্তকরণের সঠিকতা বাড়িয়ে দেয়। যেসকল কণ্ঠ শনাক্তকরণ সিস্টেম "প্রশিক্ষণ" ধাপ ব্যবহার করে না, সেগুলোকে "বক্তা-স্বাধীন ব্যবস্থা" ("speaker independent"[1] systems)। যেসকল কণ্ঠ শনাক্তকরণ সিস্টেম "প্রশিক্ষণ" ধাপ ব্যবহার করে, সেগুলোকে "বক্তা-নির্ভর ব্যবস্থা" ("speaker dependent"[1] systems)।

Speech recognition applications include voice user interfaces such as voice dialing (e.g. "call home"), call routing (e.g. "I would like to make a collect call"), domotic appliance control, search (e.g. find a podcast where particular words were spoken), simple data entry (e.g., entering a credit card number), preparation of structured documents (e.g. a radiology report), determining speaker characteristics,[2] speech-to-text processing (e.g., word processors or emails), and aircraft (usually termed direct voice input).

The term voice recognition[3][4][5] or speaker identification[6][7] refers to identifying the speaker, rather than what they are saying. Recognizing the speaker can simplify the task of translating speech in systems that have been trained on a specific person's voice or it can be used to authenticate or verify the identity of a speaker as part of a security process.

From the technology perspective, speech recognition has a long history with several waves of major innovations. Most recently, the field has benefited from advances in deep learning and big data. The advances are evidenced not only by the surge of academic papers published in the field, but more importantly by the worldwide industry adoption of a variety of deep learning methods in designing and deploying speech recognition systems.