Практическое задание №4. Автоматизированный контент-анализ с моделью текста
Для анализа я выбрала два текста: статья Кинопоиска о прошедшей премии Оскар (https://www.kinopoisk.ru/media/news/4010790/) статья Кинопоиска о предстоящем сериале про Гарри Поттера (https://www.kinopoisk.ru/media/news/4010811/). Текст про Оскар Текст про Гарри Поттера По word cloud можно составить представление о чём будет статья. Word cloud разделяет слова на главные и второстепенные. По большим словам можно сразу определить о чем текст, маленькие дополняют. По модели текста можно понять, что это за статья, только если знать заранее. Модель текста не отражает содержание текста, так как выделяет ключевые слова, в том числе предлоги, которые составляют половину ключевых слов. По методике Word cloud легче определить тематику текстов.