Кто открыл США? ))
Комментарии участников:
Различий между образами материалов для вставки на сайт нет: через «Добавить материал» с левой панели.
Перечень таких видов и внутривидовых вариантов (видео, картинки, твиты) продолжает расширяться, например, с лент социальных сетей.
Важен факт, тема, событие, комментарий, а не его вид: например афоризм, цитата или кусочек статьи из учебника ввод видом картинок. «Материал» лица не имеет.
В данном конкретном случае ссылка доставляет ;) Думаю в этом дело. Хотя наверняка не знаю.
Перечень таких видов и внутривидовых вариантов (видео, картинки, твиты) продолжает расширяться, например, с лент социальных сетей.
Важен факт, тема, событие, комментарий, а не его вид: например афоризм, цитата или кусочек статьи из учебника ввод видом картинок. «Материал» лица не имеет.
В данном конкретном случае ссылка доставляет ;) Думаю в этом дело. Хотя наверняка не знаю.
1.Управление неструктурированной информацией
2.Интегрированная обработка неструктурированных данных
3.Извлечение информации
Не следует путать с Data Mining.
Извлечение информации (англ. information extraction) — это задача автоматического извлечения (построения) структурированных данных из неструктурированных или слабоструктурированных машиночитаемых документов.
Извлечение информации является разновидностью информационного поиска, связанного с обработкой текста на естественном языке. Примером извлечения информации может быть поиск деловых визитов — формально это записывается так:
НанеслиВизит(Компания-Кто, Компания-Кому, ДатаВизита), — из новостных лент, таких как: «Вчера, 1 апреля 2007 года, представители корпорации Пепелац Интернэшнл посетили офис компании Гравицап Продакшнз».
Главная цель такого преобразования — возможность анализа изначально «хаотичной» информации с помощью стандартных методов обработки данных.[1] Более узкой целью может служить, например, задача выявить логические закономерности в описанных в тексте событиях.[2]
В современных информационных технологиях роль такой процедуры, как извлечение информации, всё больше возрастает — из-за стремительного увеличения количества неструктурированной (без метаданных) информации, в частности, в Интернете. Эта информация может быть сделана более структурированной посредством преобразования в реляционную форму или добавлением XML разметки.[3] При мониторинге новостных лент с помощью интеллектуальных агентов как раз и потребуются методы извлечения информации и преобразования её в такую форму, с которой будет удобнее работать позже.
Типичная задача извлечения информации: просканировать набор документов, написанных на естественном языке, и наполнить базу данных выделенной полезной информацией. Современные подходы извлечения информации используют методы обработки естественного языка, направленные лишь на очень ограниченный набор тем (вопросов, проблем) — часто только на одну тему. Например, «Конференция по Пониманию сообщений» (en:Message Understanding Conference, MUC) — это конференция соревновательного характера и в прошлом она фокусировалась на таких вопросах:
MUC-1 (1987), MUC-2 (1989): Военно-морские операции.
MUC-3 (1991), MUC-4 (1992): Терроризм в латиноамериканских странах.
MUC-5 (1993): Венчурные операции в области микроэлектроники.
MUC-6 (1995): Новостные статьи об изменениях в управляющих процессах.
MUC-7 (1998): Отчёты о запусках спутников.
Тексты на естественном языке могут потребовать некоего предварительного преобразования на язык (например, RDF — Resource Description Framework), понятный для компьютера.
Типичные подзадачи извлечения информации:
Распознавание именованных элементов (сущностей), например: имён людей, названий организаций, географических названий, событий, временны́х и денежных обозначений и пр.
Разрешение анафоры и кореференций: поиск связей, относящихся к одному и тому же объекту. Типичный случай таких ссылок — местоименная анафора.
Выделение терминологии: нахождение для данного текста ключевых слов и словосочетаний (коллокаций).
Автореферирование: выделение из текста смысловой, эмотивной, оценочной и пр. информации. Бывает генеративным и декларативным.
Вот типичная примерная информационная ловушка для неструктурированных данных (на первый взгляд полный хаос):

Кстати, эта новость пока не получила ни единой «проблемы». Ну, не из уважения же к разместившему? Здесь есть важная слабо (с точки зрения нашего сайта) структурированная информация. И что же? Удалять её за это? Не исключён даже выход её в ТОП, как тех, у кого есть грамматические ошибки в заголовках. Важно с грязной водичкой ребёночка из ванночки не выплеснуть.
это как раз то, чем я занимаюсь и за что мне платят деньги клиенты. Российский бизнес, кстати говоря, ну тот самый который замучен госчиновникам имеет тенденцию исполнять свои финансовые обязательства не слишком добросовестно в отличии от бизнесменов из США и ЕС. Не все, само собой, но процент скама, которые хочет тебя каким-то образом обмануть гораздо выше чем в среднем. Поэтому я сейчас считаю, что плач ярославны ру-биза по поводу гос-ва — смешным, сами хороши.
Я открою «страшный» секрет: любой размещаемый здесь материал не имеет большого значения, значение имеет наша реакция на него (активная или пассивная), как в любых системах мониторинга или экспертных системах.
Это просто тестовая площадка, полигон для проверки вбрасываемого материала. По этому интересу и вниманию система индексирует материал и сама выстраивает его структуру по рейтингу СМИ, авторов, предприятий, персон, изданий, и т.д., и т.п.
Важно не мнение или точка зрения, важны даже не только наши «плюсики» или «минусики», важена статистика новости (
см. справа)
Вот и у этой нашей «уродочки», в которой мы это пишем, через 1 час и 7 минут после размещения в воскресенье утром:
Это просто тестовая площадка, полигон для проверки вбрасываемого материала. По этому интересу и вниманию система индексирует материал и сама выстраивает его структуру по рейтингу СМИ, авторов, предприятий, персон, изданий, и т.д., и т.п.
Важно не мнение или точка зрения, важны даже не только наши «плюсики» или «минусики», важена статистика новости (

Вот и у этой нашей «уродочки», в которой мы это пишем, через 1 час и 7 минут после размещения в воскресенье утром:
Просмотров: 44
Ссылку посетили: 1
Примерно голосов до топа: 8
В Азербаиджане не видел учебников на русском языке. Но учебников где по фильмам Эйзенштеина пишут историю (Александр Невский) В России навалом. Для людей читающих первоисточники(летописи) такой бред называется «духовные скрепы»