Сообщения

Сообщения за апрель, 2025

Практическое задание №4. Автоматизированный контент-анализ с моделью текста

Изображение
Для анализа я выбрала два текста:  статья Кинопоиска о прошедшей премии Оскар (https://www.kinopoisk.ru/media/news/4010790/)  статья Кинопоиска о предстоящем сериале про Гарри Поттера (https://www.kinopoisk.ru/media/news/4010811/).  Текст про Оскар Текст про Гарри Поттера По word cloud можно составить представление о чём будет статья. Word cloud разделяет слова на главные и второстепенные. По большим словам можно сразу определить о чем текст, маленькие дополняют. По модели текста можно понять, что это за статья, только если знать заранее. Модель текста не отражает содержание текста, так как выделяет ключевые слова, в том числе предлоги, которые составляют половину ключевых слов.  По методике Word cloud легче определить тематику текстов. 

Практическое задание №2. Структурный Sentiment анализ информации с моделями MDS, ACM и оценкой дисперсии

Изображение
Для проведения анализа я выбрала два текста о сериале "The Last Of Us", но разной эмоциональной направленности. Первый - нейтрально положительная статья-обзор от Кинопоиска на начало второго сезона сериала. Второй - негативная рецензия на первый сезон сериала. Первый текст: Второй текст:  Вывод: первый текст более положительный, но менее эмоциональный, чем второй. Модель АСМ дает наиболее точную оценку характеру эмоций текста. А модель Feature Statistics наиболее точно показывает насколько ярко эти эмоции выражены в тексте.

Практическое задание №3. Sentiment Analysis в социальных медиа

Изображение
1. Pedro Pascal Соотношение позитивных упоминаний к негативных 7:3. Преобладают нейтральные (66%) и позитивные посты (23%). Общее количество упоминаний: 418. Преобладает видеоконтент (33%), после него фото (27%). Ключевые слова дают понять, что пользователей интересуют роли Педро Паскаля в кино и сериалах, в особенности в сериале The Last Of Us.  2. Yura Borisov Соотношение позитивных упоминаний к негативным: 10:0. Преобладают нейтральные (63%) и позитивные (36%) упоминаний, негативных упоминаний оказалось всего 1% от общего количества. Общее количество упоминаний: 206. Преобладает видеоконтент (35%) и статусы (35%). Ключевые слова дают понять, что упоминания Юры Борисова связаны с его ролью в фильме «Анора» и номинацией за роль второго плана . По всей видимости, его упоминают в постах о номинантах и победителях премии Оскар. 3. Timothee Chalamet Соотношение позитивных упоминаний к негативным: 4:1. Преобладают нейтральные (66%) и позитивные (28%) упоминаний.  Общее количество ...

Практическое задание №6. Графический анализ

Изображение
1) Модель Image Grid показалась мне более наглядной. По этой модели легче определить по каким признакам картинки могли быть сгруппированы, так как сами изображения присутствуют на схеме и есть возможность их сопоставить. Но в целом, обе модели разделили изображения примерно одинаково, есть отличия, но по какому принципу происходит разделение - не совсем ясно. 2) Для анализа я выбрала обложки популярных поп-альбомов. На модели Image Grid они сгруппировались по цвету (обложки голубого, синего, сиреневого цвета в одной группе, зелёная обложка отдельно, обложки с белыми элементами левее), по схожести элементов. Частично я согласна с тем, как программа разделила изображения, но чаще логика не прослеживается. 

Практическое задание №1. Фоносемантический анализ

Изображение
Для анализа я выбрала тексты песен группы Би-2 разных периодов творчества. Текст 1. "Зажигать" Текст 2. "Компромисс" Текст 3. "Мосты" Текст 4. "Научи меня быть счастливым" Текст 5. "Пора возвращаться домой" 1) Отличается ли эмоциональная составляющая в рассмотренных вами текстах? "Зажигать", "Компромисс" и "Пора возвращаться домой" можно отнести к одной группе, они в основном угловатые, злые, мужественные и сильные. Текст песни "Мосты" схож с предыдущими текстами, но его отличает наличие ярко выраженных только позитивных характеристик: грубый, мужественный, холодный. "Научи меня быть счастливым" значительно отличается от других текстов, он в основном яркий и безопасный, единственный текст, в котором высокий показатель безопасный. 2) Какие шкалы вы использовали для оценки? Почему вы считаете их наиболее удачными? Для оценки я использовала негативные шкалы: угловатый, злой Из позитивных: м...