Словарный запас русского рэппера

07.05.2014 22:46

Как-то раз я сидел в раздумиях о женщинах и русском рэпе. Обычно я это делаю на pornhub.com и porno-rap.com, но в этот раз все размышления были внутри. «Как можно называть здоровой культуру, где каждый с завидным постоянством ебёт чужих мам/девушек?» — промелькнуло в голове. Я решил узнать точно, в числах, как много у нас ебут чужих мам. С этого началась рэп-аналитика в числах, о которой мы сегодня вам расскажем.

Примерно в то же время в интернете всплыли два крутых доклада об анализе западных исполнителей. Первый вы скорее всего уже видели, есть ещё второй, более технический, но не менее интересный:

На западе есть rapgenius, у нас есть текстовая база rap-text.ru, на материалах которой основан весь анализ ниже.

 

Словарный запас

По данным Википедии, А. С. Пушкин имел словарный запас 20 тыс. слов, Ленин — 37 тыс. слов. Сколько же имеют в запасе русские рэпперы? Для ответа на этот вопрос прежде всего важно понимать, что количество композиций (объём написанных текстов) коррелирует с количеством уникальных слов. Можно построить двумерное распределение количества уникальных слов против общего количества слов, на котором отчётливо видна корреляция:

Очевидно, говорить что-то про область слева снизу трудно из-за малых объёмов текстов, да и в общем там находится какой-то шлак, на который всем похуй. Осталось определить где кончается эта «область шлака». Можно сделать какой-нибудь хитрый фит(fit, а не feat.) или натренировать классификатор, но поступим проще и просто возьмём всех рэперов с количеством уникальных слов больше 4000. Теперь рассчитаем для каждого значение , и отсортируем кандидатов по нему.

Вот TOP-20 со значениями искомой переменной (предварительно список прошел фильтр расового отбора):

  1. Жёлтая ветка 0.472
  2. Проект Увечье 0.460
  3. Крип-А-Крип 0.445
  4. Дядя Женя 0.414
  5. Oxxxymiron 0.404
  6. Дымовая завеса 0.404
  7. Brick Bazuka 0.400
  8. Соль Земли 0.391
  9. RE-pac 0.391
  10. 5 Плюх 0.385
  11. Типси Тип 0.384
  12. ГРОТ 0.379
  13. ОУ74 0.378
  14. 9 грамм 0.375
  15. Ноггано 0.368
  16. Миша Маваши 0.363
  17. Babangida 0.347
  18. АК-47 0.343
  19. 25/17 0.340
  20. Триагрутрика 0.339

Полный список вы можете найти здесь

 

Мамоёбство

Всегда любуюсь на этот список после прослушивания баттл-рэпа. Мам у нас ценят, ну а если поёбывают, то только чуть чуть, для свободомыслия. Число рядом с песней — количество упоминания «мам»:

  1. Дуня - Бездельник 21
  2. Shot - Моя вторая мама 20
  3. Восточный Округ feat. Slim - Мама 16
  4. ST feat. Джи Вилкс - Моя улица 16
  5. T1One feat. Анастасия К. - Мама 16
  6. Michgunz - Владик 15
  7. Птаха - Первое слово 15
  8. Серега - Говорила мама 14
  9. Kav-Kaz - Двадцать девятое ноября 13
  10. Ай-Q - Жизнь растамана 12
  11. Миша Крупин - Мама Лиза 12
  12. Мистер Малой - Руки прочь от Майкла Джексона 12
  13. GuntanoMo - Мама говорила 11
  14. D1MASS - Мама 11
  15. ГИГА feat. Sokolovsky - Мама 11
  16. Oxxxymiron - Судьба моралиста 10

 

(BONUS) Наглухо заебавший Босх

По мотивам наглухо заебавшего Кусто ловите треков с наглухо заебавшим Босхом:

  1. Krec - Весна
  2. Big Black Boots - В чем фишка?
  3. 4пыль - Стопки
  4. Just (TERRA INCOGNITA) - Жребий брошен
  5. Oxxxymiron - Лондон против всех
  6. palach - Байки у костра
  7. Дядя Женя - Мой хип-хоп
  8. Дядя Женя - Очевидное - невероятно
  9. Смоки Мо feat. Арнольд - Отрывки из стихов
  10. Соль Земли - В отрыв
  11. Проект Увечье - Строго
  12. Типси Тип - Органы

p.s. Ребята, список основан на базе данных реальных текстов и математических вычислениях, науке абсолютно похуй на наши и ваши личные пристрастия. Любой старшеклассник может проверить эти расчеты.