Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

ТехнологияComprenoдляобработкитекстовнаестественномязыке.МножествоприкладныхзадачпообработкетекстовнаестественномязыкеспомощьюуниверсальнойлингвистическойплатформыCompreno.




ABBYYCompreno–этоуникальнаятехнологияанализаипониманиятекстовнаестественномязыке.Вотличиеотсистем,основанныхнастатистикеиправилах,ABBYYComprenoвыполняетполныйсемантико-синтаксическийанализтекста,создаетегоуниверсальноепредставление,извлекаетсущности,событияисвязимеждуними.

УниверсальнаяСемантическаяИерархия(УСИ)УниверсальнаяСемантическаяИерархия(УСИ)–ядроязыкапонятий–насчитываетсегодня60тысячэлементоввуниверсальномразделекогнитивноймодели,80тысяч–врусскомразделе,и90тысяч–ванглийском.

ПроектComprenoисходитизтрехосновополагающихпосылок:1)использованиекачественногоибескомпромиссногосинтаксическогоанализа;созданиеуниверсальнойкогнитивноймоделиязыка,возможностькоторойопределяетсяаксиомойотом,чтолюди,живущиевразныхусловияхиговорящиенаразныхязыках,мыслятодинаково.Формывыражениямыслиразные,нопонятийныйаппаратсовпадает.

ИсходяизэтихпосылокбыласформулированаидеяУниверсальнойСемантическойИерархии(УСИ),способнойописыватьявленияотобщегокчастному.НасоставлениеэтойиерархииукомпанииABBYYушло15лет.

АлгоритммашинногопереводанаУСИ

Алгоритммашинногопереводатекстаделитсяна4этапа:1этап–Лексико-морфологическийанализ.Наэтомэтапеисходныйтекстделитсянаабзацы,предложенияислова,технологияопределяетчастиречииморфологическиепризнакислов(род,число,падежидругие);2этап–Синтаксическийанализ.Технологиявыделяетпредложениявтексте,определяетихструктуруисвязимеждусловамивпредложении;3этап–Семантическийанализ.ABBYYComprenoопределяетзначениякаждогослова,строитсемантическуюструктурупредложениянаосновесвязей,которыебылиустановленынапрошломэтапе;4этап–Прагматическийуровеньанализа.Наэтомэтапенакладываетсяпрагматическийслойанализатекста,применяютсяонтологии(терминологиядляконкретнойпредметнойобластианализа)иправилаизвлечениянужныхобъектов.Врезультатеподборсловдляпереводаосуществляетсяненапрямуюизпервогоязыка,аизпонятийногонабора,который,условноговоря,«висит»натойжеветкеуниверсальногосемантическогодерева,нотолькоужесосторонывторогоязыка.Результатоманализаявляетсяуниверсальноепредставлениеинформации,чтопозволяетструктурироватьконтентвнужномзаказчикувиде.Такимобразом,ABBYYComprenoпозволяетэффективнорешатьзадачиклиента,связанныесанализомиизвлечениемважныхфактов,интеллектуальнымпоискомиклассификациейинформации.ПосколькумодельУСИсквозная,нижестоящиеэлементысистемыпоиерархиинаследуютпризнакивышестоящихэлементов.Этопростое,обстоятельствопозволяетдобиватьсябеспрецедентнойточностимашинногоперевода,посколькукаждоесловоизпереводимогопредложенияописываетсямаксимальнымнаборомпонятийныхэквивалентов,причемнетольковидового,ноиродовыхкачествнавсехуровняхсмысловойиерархии.

ВУСИпредусмотренывзаимосвязимеждуэлементамиструктуры,относящимисякразнымклассам,иэтисвязитакжеструктурированыиформализированы,чтопозволяетвыполнятьмногоуровневыйпонятийныйанализтекста,такжеповышающийкачествоперевода

Прикладныезадачи,решаемыеспомощьюABBYCompreno

–Автоматическоераспознаваниеречи;

–Классификациядокументовипоискпохожихдокументовпосмыслу;

–Анализтональностивмониторинге;

–Реферированиеианнотирование(написаниекраткогосодержаниядлинныхдокументов)

–Определениесмысламногозначныхслов(разрешениеомонимии)

ВпроцессеанализатекстаABBYYComprenoвыявляетомонимы(разныепозначению,ноодинаковыепонаписаниюслова)ирешаетпроблемуихмногозначностинаосновеанализаконтекста.Этопозволяетсущественноповышатьрелевантностьрезультатовпоисковойвыдачи,атакжеточностьвыявленияконкретныхобъектоввтекстах.

–Восстановлениепропущенныхсловвтексте(разрешениеэллипсиса)

Многиеязыкипозволяютопускатьразличныесловавтексте,безкоторыхчеловекитакможетпонять,очёмидётречь,исходяизконтекста.Благодаряанализусмыслатекста,анеотдельныхслов,ABBYYComprenoтакже«понимает»контекстивосстанавливаетпропущенныеслова,важныедляпоследующегоанализаилипоиска:

–Анализсложныхлингвистическихсвязеймеждусловами

Выявлениесвязеймеждусловамииграетключевуюрольвпоисковыхитекстово-аналитическихзадачах.Благодаряполномусемантико-синтаксическомуанализу,технологияспособнаучестьмножествоособенностейестественногоязыка,которыечастоявляютсяпрепятствиемдлякачественногоопределенияотношенийвтекстах:–Отношениямеждусловами,находящимисядалекодруготдругаABBYYComprenoопределитотношениямеждувзаимосвязаннымисловамидажевмногострочныхсложносочиненныхпредложенияхсосложнымиоборотами.–Определениесвязимеждуобъектом,выраженнымсуществительным,изаменяющимегоместоимением(определениеанафорическихсвязей).Благодаряанализусинтаксическихисемантическихсвязей,ABBYYComprenoпозволяетопределять,каксвязанысловаизаменяющиеихместоимения:

ПреимуществатехнологиABBYYCompreno:

Точныйанализ.Благодаряуникальноститехнологииувеличиваетсякачество(полнотаиточность)анализазначимойдлябизнесаинформации.

Быстрыйзапускпроекта.ТехнологииABBYYComprenoпозволяютбездополнительныхнастроекизвлекатьиздокументовключевыефактыинастраиватьсянапредметнуюобластьзаказчикавнесколькоразбыстрее,чемсистемынаосновестатистикииправил.

Качественнаяработасинформациейнарусскомязыке.РешенияABBYYпозволяюторганизациямразныхотраслей:Анализировать,классифицироватьинформациюиизвлекатьважныефакты,осуществлятьсемантическийпоискинформациивкорпоративныхинформационныхсистемахивнешнихисточниках.


 










Последнее изменение этой страницы: 2018-04-12; просмотров: 179.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...