Българският език застрашен от дигитална смърт | IT.dir.bg

17-11-2017 20-11-2018
Българският език застрашен от дигитална смърт

Българският език застрашен от дигитална смърт

Според ново изследване на водещи европейски експерти в сферата на езиковите технологии, повечето европейски езици са заплашени от дигитална смърт. Българският е сред езиците с висок риск от отмиране в дигиталната епоха.

2 203
След оценка на състоянието на езиковите технологии за 30 от близо 80-те езика, които се говорят в Европа, експертите достигнаха до извода, че езиковите технологии за 21 от 30-те изследвани езика или са „недоразвити”, или са „слабо развити”.

Изследването е проведено от Европейската мрежа за върхови постижения META-NET, в която членуват 60 изследователски центъра от 34 страни, сред които е и Институтът за български език „Проф. Любомир Андрейчин”, съобщиха от пресцентъра на БАН, цитирани от "Фокус".

Проучването е проведено от над 200 експерти и е обобщено в Бели книги за различните езици (30 на брой), които са публикувани от META-NET в печатни издания и онлайн. Те включват обзор и оценка на състоянието на наличните езикови технологии за всеки език в четири различни категории: автоматичен превод, обработка и синтез на реч, анализ на текст и общо състояние на езиковите ресурси.

В поне една от тези категории 21 от 30-те езика получават най-ниската оценка, т.е. за тях липсват езикови технологии или съществуващите технологии са недоразвити. Категорията със слаба оценка за българския език е автоматичният превод. В останалите той получава средна оценка.

Няколко езика, сред които исландски, латвийски, литовски и малтийски, получават най-ниска оценка и в четирите категории.

Състоянието на наличните езикови ресурси и технологии не е оценено като „отлично” за нито един език, ресурсите за английски получават висока оценка, след това се нареждат холандски, френски, немски, италиански и испански език, които са оценени като „средно развити”.

Технологиите и ресурсите за езици като баски, български, каталански, гръцки, унгарски и полски са категоризирани като „фрагментарно развити”, което означава, че са сред езиците с висок риск от отмиране в дигиталната епоха. Тоест, за момента българският език не е застрашен, но ситуацията би могла да се промени значително с навлизането на ново поколение технологии, използващи наистина ефективно естествените езици, съобщиха от БАН.
Българският език застрашен от дигитална смърт

Българският език застрашен от дигитална смърт

Според ново изследване на водещи европейски експерти в сферата на езиковите технологии, повечето европейски езици са заплашени от дигитална смърт. Българският е сред езиците с висок риск от отмиране в дигиталната епоха.

2 203
След оценка на състоянието на езиковите технологии за 30 от близо 80-те езика, които се говорят в Европа, експертите достигнаха до извода, че езиковите технологии за 21 от 30-те изследвани езика или са „недоразвити”, или са „слабо развити”.

Изследването е проведено от Европейската мрежа за върхови постижения META-NET, в която членуват 60 изследователски центъра от 34 страни, сред които е и Институтът за български език „Проф. Любомир Андрейчин”, съобщиха от пресцентъра на БАН, цитирани от "Фокус".

Проучването е проведено от над 200 експерти и е обобщено в Бели книги за различните езици (30 на брой), които са публикувани от META-NET в печатни издания и онлайн. Те включват обзор и оценка на състоянието на наличните езикови технологии за всеки език в четири различни категории: автоматичен превод, обработка и синтез на реч, анализ на текст и общо състояние на езиковите ресурси.

В поне една от тези категории 21 от 30-те езика получават най-ниската оценка, т.е. за тях липсват езикови технологии или съществуващите технологии са недоразвити. Категорията със слаба оценка за българския език е автоматичният превод. В останалите той получава средна оценка.

Няколко езика, сред които исландски, латвийски, литовски и малтийски, получават най-ниска оценка и в четирите категории.

Състоянието на наличните езикови ресурси и технологии не е оценено като „отлично” за нито един език, ресурсите за английски получават висока оценка, след това се нареждат холандски, френски, немски, италиански и испански език, които са оценени като „средно развити”.

Технологиите и ресурсите за езици като баски, български, каталански, гръцки, унгарски и полски са категоризирани като „фрагментарно развити”, което означава, че са сред езиците с висок риск от отмиране в дигиталната епоха. Тоест, за момента българският език не е застрашен, но ситуацията би могла да се промени значително с навлизането на ново поколение технологии, използващи наистина ефективно естествените езици, съобщиха от БАН.