книга О поиске эквивалентных текстов
0

О поиске эквивалентных текстов

  • Сейчас читают 0
  • Отложили 0
  • Прочитали 0
  • Не дочитали 0
В статье описан подход к формированию поискового множества, используемого при определении эквивалентов текста. Задача такого вида возникает при поиске дубликатов текста, определении авторства и возможного плагиата, организации библиотечного поиска, а также при создании поисковых...Ещё
В статье описан подход к формированию поискового множества, используемого при определении эквивалентов текста. Задача такого вида возникает при поиске дубликатов текста, определении авторства и возможного плагиата, организации библиотечного поиска, а также при создании поисковых систем Интернета. В подходе, представленном в статье, учитывается ряд особенностей: частотность слов, пунктуация, морфемная структура слов, регистр букв и артефакты текста (специфические цифро-буквенные сочетания). Разработанная программа протестирована на наборе данных, в число которых включены как оригиналы текстов, так и их специальным образом модифицированные варианты. В результате проведенного эксперимента определены слабые стороны подхода. Приведены варианты по улучшению разработанного программного средства и схема взаимодействия модулей разработанной программы после модификации.
  • Синергия

Материалы

Отзывы

Раз в месяц дарим подарки самому активному читателю.
Оставляйте больше отзывов, и мы наградим вас!
Чтобы добавить отзыв, вы должны .

Цитаты

Вы можете первыми опубликовать цитату

Чтобы добавить цитату, вы должны .

Где найти