Практическое задание №4. Автоматизированный контент-анализ с моделью текста

Для анализа я выбрала два текста: 
статья Кинопоиска о прошедшей премии Оскар (https://www.kinopoisk.ru/media/news/4010790/) 
статья Кинопоиска о предстоящем сериале про Гарри Поттера (https://www.kinopoisk.ru/media/news/4010811/). 

Текст про Оскар

Текст про Гарри Поттера


По word cloud можно составить представление о чём будет статья. Word cloud разделяет слова на главные и второстепенные. По большим словам можно сразу определить о чем текст, маленькие дополняют.
По модели текста можно понять, что это за статья, только если знать заранее. Модель текста не отражает содержание текста, так как выделяет ключевые слова, в том числе предлоги, которые составляют половину ключевых слов. 

По методике Word cloud легче определить тематику текстов. 

Комментарии

Популярные сообщения из этого блога

Практическое задание №6. Графический анализ

Практическое задание №1. Фоносемантический анализ

Практическое задание №3. Sentiment Analysis в социальных медиа