Не Эллочка-людоедка: рэперы с самым богатым словарным запасом |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2019-01-21 20:30
Литераторы любят говорить о словарном запасе Уильяма Шекспира: в своих работах он использовал 28 829 уникальных слов. Это позволяет предположить, что всего он знал более 100 000 слов и, возможно, имел один из богатейших словарных запасов в мире на тот момент.
Журналист Мэтт Дэниелс решил сопоставить это значение с тем, что дает анализ текстов хип-хоп-музыкантов. Для этого использовались первые 35 000 слов из текстов песен каждого исполнителя. Таким образом плодовитых музыкантов, таких как Jay-Z, можно будет сравнить с относительно более новыми, например Drake.
35 000 слов — это содержание от трех до пяти студийных альбомов и мини-альбомов. В том случае, если исполнителю немного не хватало до нужного количества слов, использовались микстейпы. У многих рэперов, например у Biggie и Kendrick Lamar, недостаточно официально опубликованных текстов песен, чтобы включить их в исследование. В качестве критериев оценки были включены количественные данные Шекспира и Германа Мелвилла с использованием такого же подхода — 35 000 слов из нескольких разных пьес для Шекспира и первые 35 000 слов из романа «Моби Дик» для Мелвилла.
Для того чтобы определить объем словарного запаса музыкантов, использовалась следующая методика лексического анализа: каждое слово считалось один раз, следовательно, слова pimps, pimp, pimping и pimpin учитывались как четыре уникальные единицы. Из корпуса текстов были удалены апострофы, чтобы избежать проблем с некоторыми парами слов (например, pimpin’ и pimpin). И все равно база слов далека от совершенства. В хип-хопе много сленговых выражений, которые трудно истолковать (например, shorty или shawty), слов-композитов, таких как king shit, и повторяющихся мотивов.
Тем не менее это исследование представляется интересным. Из 85 исполнителей, рассмотренных в рамках проекта, ниже представлены те, кто занял верхние строчки результатов. № 1. Aesop Rock
При первой публикации результатов Мэтт не включил Aesop Rock, посчитав его слишком трудным для понимания, но участники сообщества на сайте Reddit, посвященного хип-хопу, высказали бурное возмущение. По их утверждению, Aesop Rock точно получил бы первое место, и действительно, количество употребленных им слов оказалось значительно выше, чем у всех остальных рассмотренных музыкантов, так что его пришлось добавить в визуальную репрезентацию данных. На самом деле результат Aesop Rock должен располагаться еще правее, но автор поленился исправлять масштаб. № 5. Группа Wu-Tang Clan
Впечатляет, что Wu-Tang Clan занял пятое место, учитывая то, что все десять участников группы с крайне разными музыкальными стилями в равной степени участвуют в создании песен. Добавьте к этому то, что соло-альбомы GZA, Ghostface, Raekwon и Method Man’s также вошли в первую двадцатку, — в частности, GZA оказался на четвертом месте.
Рассмотрим пять студийных альбомов Wu-Tang Clan подробнее, чтобы разобраться с вкладом каждого участника группы. Ниже представлена таблица с количеством слов, написанных каждым рэпером, и процентом, которое это количество составляет от общего объема.
Чтобы проанализировать словарный запас каждого рэпера (количество использованных уникальных слов) в первых пяти альбомах Wu-Tang, был использован порог в 3500 слов, чтобы все участники оказались на равных. Таким образом удалось включить GZA, но, к сожалению, у Ol’ Ddirty Bastard, Cappadonna и Masta Killa оказалось недостаточно слов.
U-God и GZA внесли большой вклад в среднее арифметическое количества употребленных слов участников группы. Вклад Raekwon и Method Man’s ниже среднего по группе, но обратите внимание, что их результат все равно оказывается выше, чем у большинства хип-хоп-исполнителей. № 28, 54. OutKast и E-40
Неудивительно, что E-40 вошел в верхние 20%: его считают создателем многих сленговых выражений. Примерами приписываемых ему фраз являются all good, pop ya collar, shizzle и you feel me.
У дуэта Outkast словарный запас стал частью их стиля: в песнях часто используются словослияния (ATLiens, Stankonia), присущая южанам тягучесть выговора (nahmsayin, ery’day), а также выдуманный сленг (flawsky-wawsky).
Другие исполнители, территориально расположенные на Юге, отличаются от Outkast бедностью словаря. Можно предположить, что это следствие особенности стиля кранк, для которого характерна вопросно-ответная структура — именно из-за нее слова чаще повторяются. № 49 и 59. Busta Rhymes и Twista
Оба рэпера известны своей скоростью чтения, поэтому отрадно видеть, что тексты их песен остаются разнообразными. № 101, 102, 103, 131. Kanye West, Snoop Dogg, 2pac, Lil Wayne
Некоторые из наиболее известных хип-хоп-исполнителей оказались в хвосте списка.
Lil Wayne никогда не славился особенной сложностью использованных слов, но было неожиданно, что результаты 2pac, Snoop и Kanye West окажутся значительно ниже среднего.
Так что же все это значит? Пользователь блога io9 дал Мэтту Дэниэлсу пищу для размышлений, написав, что в треке «Moment of Clarity» из альбома «The Black Album» Jay-Z сравнивает свою лирику с творчеством Common Sense и Talib Kweli (оба исполнителя располагаются выше, чем Jay-Z, на шкале величины словарного запаса):
I dumbed down for my audience to double my dollars
They criticized me for it, yet they all yell «holla»
If skills sold, truth be told, I’d probably be
Lyrically Talib Kweli
Truthfully I wanna rhyme like Common Sense
But I did 5 mil — I ain’t been rhyming like Common since
В этом речитативе Jay-Z рассуждает, как он сделал свои тексты проще и тупее — и это принесло ему миллионы. Мне хотелось бы рифмовать как Common Sense и Talib Kweli, говорит рэпер, но такое мастерство просто не продается.
Перевод: Вера Шимко Источник:
THE LARGEST VOCABULARY IN HIP HOP BY MATT DANIELS Источник: m.vk.com Комментарии: |
|