Содержание: 2024 | 2023 | 2022 | 2021 | 2020 | 2019 | 2018 | 2017 | 2016 | 2015 | 2014 |2013 | 2012 | 2011 | 2010 | 2009 | 2008 | 2007 | 2006 | 2005 | 2004 | 2003 | 2002 | 2001

2007, 22

М. Чандрасекар, М. Понавайко

Автоматическое распознавание речи на тамильском языке

язык: английский

получена 13.11.2007, опубликована 07.12.2007

Скачать статью (PDF, 220 кб, ZIP), используйте команду браузера "Сохранить объект как..."
Для чтения и распечатки статьи используйте «Adobe Acrobat© Reader» версии 4.0 или выше. Эта программа является бесплатной, ее можно получить на веб-сайте компании Adobe© (http://www.adobe.com/).

АННОТАЦИЯ

Речь является основным средством общения и одним из наиболее сложных сигналов. Уже более 40 лет разрабатываются системы автоматического распознавания речи, преобразования ее в текст. Исследования были сосредоточены в основном на распознавания речи на английском языке. Индийские языки структурно и синтаксически отличаются от латинских. Например, произнесение слов на тамильском языке состоит в произнесении соединения букв, общее число которых 247. В статье представлен подход к распознаванию речи на тамильском языке, использующий акустические особенности отдельных букв. При этом применяется аппарат нейронных сетей. Представлены примеры, доказывающие эффективность метода.

Ключевые слова: автоматическое распознавание речи, тамильский язык, нейронные сети

11 страниц, 3 иллюстрации

Как сослаться на статью: М. Чандрасекар, М. Понавайко. Автоматическое распознавание речи на тамильском языке. Электронный журнал "Техническая акустика", http://ejta.org, 2007, 22.

ЛИТЕРАТУРА

1. Davis K. H., Biddulph R., and Balashek S. Automatic recognition of spoken digits, Journal of Acoust. Soc. of America, vol. 24, 637–642, 1952.
2. Olson H. F., and Belar H. Phonetic Typewriter. Journal of Acoust. Soc. of America., 28(4), 1072–1081, 1956.
3. Fry D.B. Theoretical aspects of mechanical speech recognition. J. British Inst. Radio Engineer, 19(4), 211–218, 1959.
4. Forgie J. W., and Forgie C. D. Results obtained from vowel recognition Computer program. J. Acoust. Soc. of America, 31(11), 1480–1489, 1959.
5. Suzuki J., and Nakata K. Recognition of Japanese vowels-preliminary to the recognition of speech. J. Radio Res. Lab, 37(8), 193–212, I961.
6. Sakai T., and Doshita S. The phonetic typewriter. Information Processing 1962, Proc. IFIP. Congress, Munich, pp. 445–450, 1962.
7. Nagata K., Kato Y., and Chiba S. Spoken digit recognizer for Japanese language. NEC Res. Develop., 6, 1963.
8. Juang B. H., Childers D., Cox R. V., DeMori R., Furui S., Mariani J. J., Price P., Sagayama S., Sondhi M. M., and Weischedel R. The past, Present, and Future of Speech processing. IEEE signal processing magazine, pp. 24–48, 1998.
9. Jiang Minghu, Yuan Baozong, Tang Xiaofong, and Lin Biqin. Fast Learning algorithms for Time-Delay Neural Networks Phoneme Recognition. Proc. ICSP, pp. 730–733, 1998.
10. Chandrasekar C., and Sivarama Krishna Rao J. Y. Recognition of Consonant – Vowel (CV) units of Speech Indian Lnaguages. Proc. National Seminar on Information Revolution and Indian Languages, Hydrabad, pp. 22.1–22.6, Nov., 1999.
11. Ganga Shetty S.V., and Yagnanarayana B. Neural Network Models for recognition of Consonant – Vowel (CV) utterances. INNS-IEEE International Joint Conference on Neural networks, Washington DC, pp. 1542–1547, July, 2001.
12. Pusateri E., and Thong J.M. N-best List Generation using Word and Phoneme recognition fusion. 7th European Congress on Speech Communication and Technology (Euro Speech), September, 2001, Aalborg, Denmark.
13. Salomon J., King S., and Osborne M. Framewise phone classification using support vector machines. Proceedings in International Conference on Spoken Language Processing, Denver, 2002.
14. Mporas I., and Fakotakis N. Least Squares Support Vector Machine based Phoneme Recognition. SPECOM 2005, pp. 377–380, Patras, Greece, Oct. 2005.
15. Mporas I., Ganchev T., Zervas P., and Fakotakis N. Recognition of Greek Phonemes using Support Vector Machines. Springer, Berlin /Heidelberg, pp. 290–300, 2006.
16. Schafer R.W., and Rabiner, L.R. Digital Representation of speech signals. Proceedings of IEEE , vol. 63, N°4, pp. 662–677, April 1975.
17. Furui S. Cepstral analysis technique for automatic speaker verification. IEEE trans. Acoust. speech and signal processing, vol. 29, pp. 254–272, April, 1981.
18. Lippmann R. P. An Introduction to Computing with Neural nets. IEEE Acoust. speech and signal processing Magazine, pp. 4–22, April, 1987.


 

М. Чандрасекар окончил университет в Индии в 1987. С тех пор работал в промышленности, преподавал в университете. В настоящее время профессор и заведующий кафедрой в университете. Занимается исследованиями в области автоматического распознавания речи.

e-mail: chandramu2000(at)yahoo.co.in

 
 

М. Понавайко окончил университет по специальности «электротехника» в 1972, работал в электроэнергетике Индии, диссертацию защитил в 1983. С 1986 - на преподавательской работе. В настоящее время - проректор университета в Индии. Научные интересы: энергетика, вычислительная техника. М. Понавайко - автор 14 учебников по вычислительной технике, более чем 60 статей.

e-mail: ponnav(at)gmail.com