Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Додаткові сервіси (послуги), які надаються пошуковими системами Інтернет




У більшості випадків пошуковики надають статистику в кілька спрощеній формі. Наприклад, сервіс Яндекса узагальнює всі словоформи (мн. і од. Число, відмінки), опускає прийменники (за, на, під і т. д.) і питальні форми (що, коли, як і т. п.). Тобто за допомогою Яндекса не можна буде дізнатися, наприклад, що шукають частіше: од. число «Дім» або мн. «Дома», а тільки загальна кількість запитів по всіх словоформам конкретного одиничного слова.

Рамблер в цьому плані більш точний, і його звіти, за замовчуванням, видають поєднання запитів, в тому вигляді, в якому їх ввів в рядок пошуку користувач. Для видачі звіту, подібного звіту Яндекса, в Рамблері передбачений мова запитів. Наприклад, для отримання всіх словоформ від слова «Дерево» необхідно буде ввести «Дерев *» [7].

Цікавою особливістю, в порівнянні з іншими сервісами статистики, володіє статистика Google. Крім стандартного набору звітів, у нього існує також звіт про «середній ціні запиту» (Estimated Avg. CPC) [8]. Пошукова система видає інформацію про вартість, яку повинен буде заплатити рекламодавець за кожен клік по його рекламі, в рамках обраного «ключового слова». Так, наприклад, вартість одиничного кліка за запитом Britney Spears на початок 2007 - 35 центів. Але в той же час більшість дорогих запитів (від 5 доларів і вище - за клік) не є масовими і популярними.

Слід зазначити, що пошукові системи (за їх власними запевненнями) не продають місця в результатах пошуку [9]: йдеться лише про контекстну рекламу, яка розміщена окремо від самих результатів (звичайно праворуч) або на сайтах партнерської мережі.

Обробка текстової інформації

Робота з текстами - важлива складова частина діяльності людей багатьох професій. Обробка текстів, підготовка різного виду документів складають значну частину робіт, виконуваних сьогодні на ПК.

До складу документів, які готуються на ПК, можуть входити текстові дані, таблиці, математичні формули, графічні об'єкти і т.д. Головна задача будь-якого текстового редактора полягає у забезпеченні оптимальних для користувача умов зі створення та обробки документів.

Сучасний текстовий редактор - це програмний продукт, що забезпечує користувача ПК засобами створення, обробки та збереження документів різного ступеня складності. Текстовий редактор дозволяє робити все те, що може робити друкарка за допомогою гарної друкарської машинки. Але, крім традиційних можливостей, ПК дозволяє здійснювати якісно нові способи обробки текстових документів: вставку повторюваних фрагментів, зміну довжини рядків, автоматичний перенос слів, виділення потрібних частин тексту нестандартним шрифтом при друці й інші. Можливість попереднього перегляду отриманого документа на екрані дисплея допомагає уникнути непродуктивних витрат праці та паперу при друці.

Велике розмаїття типів документів призвело до значної кількості існуючих текстових редакторів. За типом оброблюваного документа текстові редактори класифікують так:

· Редактори текстів - призначені для створення та редагування нескладних текстів і текстів програм (Brіef, Norton Edіtor, Quіck).

· Редактори документів - призначені для роботи з документами, що структурно складаються із розділів, сторінок, абзаців і т.д. До структури документа можуть входити таблиці, графічні образи, що можуть створюватися в інших додатках. Серед редакторів, призначених для роботи з текстовими документами, можна виділити Mіcrosoft Word, Word Perfect, AmіPro, MultіEdіt.

· Редактори наукових текстів. Особливість даного класу редакторів у тому, що вони забезпечують підготовку і редагування наукових текстів, які містять велику кількість математичних формул, графіків, спеціальних символів і т.д. Серед найбільш відомих редакторів наукових текстів можна виділити системи ТЕХ і MathOr. Необхідно відзначити, що сучасні текстові редактори містять у собі засоби підготовки документів з формулами. Питання тільки в тому, як співвідносяться звичайний текст і формули. Використання редакторів наукових текстів виправдане тоді, коли текст містить багато формул.

· Видавничі системи - використовуються для підготовки великих складних документів (книги, альбоми, журнали, газети, буклети). Як приклади видавничих систем можна назвати Corel Ventura Publіsher, Adobe PageMaker, QuarkXPress. Робота з видавничими системами передбачає використання редакторів документів на етапі попередньої підготовки матеріалів. Видавничі системи призначені для верстки тексту. Верстка тексту полягає в розміщенні тексту на сторінках створюваного документа, вставці малюнків, використанні різних шрифтів стосовно документів, уже створених за допомогою редакторів текстів. Останнім часом редактори документів за своїми можливостями наблизилися до видавничих систем. Прикладом такого текстового редактора може служити Mіcrosoft Word.

Загальна тенденція в розвитку текстових редакторів полягає у створенні редакторів, які дозволяють користувачам одночасно працювати з текстами, що містять об'єкти і фрагменти різної природи. Особливо чітко це прослідковується в редакторах документів. Як правило, вихідним моментом роботи з документом є текст, до якого додаються об'єкти і фрагменти різної природи, наприклад діаграми, таблиці

 

Огляд комп’ютерних програм для обробки текстової інформації

Apache OpenNLP OpenNLP - це організаційний центр "open source" проектів, пов'язаних з машинною обробкою природної мови під егідою Apache. OpenNLP пропонує обширний Java-інструментарій обробки текстів на основі методів машинного навчання.
Link Grammar Parser Link Grammar Parser - це синтаксичний парсер англійської мови. Працює зі словником, що включає близько 60 000 словникових форм. Реалізовано на C для Unix. Є також версія для Windows API32. Має консольний інтерфейс.
Проекты Cíbola/Oleada Проекти Cíbola / Oleada реалізують великі комп'ютерні системи лінгвістичного аналізу текстів, представлених в Unicode. Компоненти системи включають засоби роботи з багатомовними текстами (MUTT), побудови конкордансу (XConcord) для текстів на більш ніж 16 мовах, статистичного аналізу, автоматичного перекладу, різні словники та тезауруси.
Russian Morphological Dictionary Програма для синтаксичного і морфологічного аналізу російськомовних текстів. Працює з вхідним ASCII-текстом. Використовується морфологічний словар.

 

 










Последнее изменение этой страницы: 2018-04-12; просмотров: 158.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...