Лингвистичен шок! Езикът ни заплашен от дигитална смърт

Архив София

25-09-2012, 12:41

Автор:

СофияУтре

Всичко от Автора

Оказва се, че повечето европейски езици са застрашени.

Българският е един от езиците, които са заплашени от дигитална смърт.

Тези тревожни данни са от изследване на водещи европейски експерти в сферата на езиковите технологии.

Оказва се, че дигитална смърт грози повечето европейски езици. Изследвани са общо 30, като при 21 езиковите технологии са „недоразвити” или „слабо развити”.

Проучването е проведено от над 200 експерти, които са отчели състоянието на наличните технологии за всеки език в четири различни категории: автоматичен превод, обработка и синтез на реч, анализ на текст и общо състояние на езиковите ресурси.

В поне една от тези категории 21 от 30-те езика (т. е. 70%) получават най-ниската оценка (т.е. за тях липсват езикови технологии или съществуващите технологии са недоразвити). За българския категорията със слаба оценка е автоматичният превод.

Няколко езика, сред които исландски, латвийски, литовски и малтийски, получават най-ниска оценка и в четирите категории. Състоянието на наличните езикови ресурси и технологии не е оценено като „отлично” за нито един език, ресурсите за английски получават висока оценка, след това се нареждат холандски, френски, немски, италиански и испански език, които са оценени като „средно развити”.

Технологиите и ресурсите за езици като баски, български, каталански, гръцки, унгарски и полски са категоризирани като „фрагментарно развити”, което означава, че са сред езиците с висок риск от отмиране в дигиталната епоха. Тоест за момента българският език (получил средна оценка в категориите обработка на реч, анализ на текст и общо състояние на езиковите ресурси) не е застрашен. Но ситуацията би могла да се промени значително с навлизането на ново поколение технологии, използващи наистина ефективно естествените езици, съобщиха от БАН.