Вы сейчас здесь
«Облако» тэгов
link, small, tagless, tiny, 2003, big, 2008, 2010, январь, декабрь, сентябрь, 2001, 2004, 2002, август, апрель, март, июль, 2009, игры, октябрь, май, июнь, февраль, 2007, ноябрь, img, 2011, quote, wow, huge, блоги, кино, игровой дизайн, ребенок, половой вопрос, технологии, вебдев, lytdybr, фразы, живой журнал, жизнь, язык, яндекс, php, 2006, людишки, 2005, поисковики, software, video, inglish, 2000, смишно, диалоги, музыка, книги, культ личности, дейтинг, политика, интернет, 1999, rss, контент, flash, я, авторские проекты, реклама, прон, next-gen mmo, ореховые скорлупки, сми, js, программирование, fight club, register, социгры, спам, english reviews, американас, потребление, беллетристика, идеи, мое величие, iphone, usability, пидорасты, battle.net, lifestyle, starcraft 2, Тёма, соционика, spectator.ru, британские ученые, развитие, Масква, бабло, литература, фото, mobile, work, болкман, титаны, hard, hobius, mysql, интеллектуальный юмор, хостинг, blogowar.ru, графика, SEO, blogowar, magic, журналистика, злоба дня, религия, стартапы, social, tf2, цитаты, gzip, warhammer, браузеры, велосипед, киви, медикаментоз, общество, оговорки, html, воспитание, мифы, паранойа, письма в редакцию, учеба, 1998, soft, soviet, twdnkumus, глянцевые журналы, монетизация, норкотики, сайты, сиськи, типографика, тьюринг, mongodb, дизайн, железо, живут же люди, лолвут, плагиат, твиттер, тренд, 2012, about, бабушки, вещи, видео, зомбоящик, игрушки, социопатия,
«Реклама»
Купить книгу AutoCAD for Interior and Space planning Using.
Персональное
об авторе и сайте
мойкруг (резюме)
на G+
порнотумблер (rss)
инстаграм (хипстерские фото)

facebook
twitter

skype: acerbial
gtalk: dmitry.smirnov


C любовью к людишкам™,
♥ 1998 - 2013.

powered by mongodb.



Голосуй сердцем

Во всех голосованиях, типа +1/-1 должно быть на самом деле +N/-M, где N!=M (N не равно M).

Так как почти никто не понял моей гениальной гипотезы, поясню.

Но сначала — в чем смысл голосования вообще. Во-первых, конечно же — ... Но это кто-то должен сказать все равно. Голосование — это выбор. Перед вами поставили пять президентов и под каждым повесили radiobutton. Выбери одного.

Понятно, что проголосовать одновременно за Жирика и за Зюгу нельза. А очень хочется.

Другое дело, когда у тебя есть много материала, и каждой твари можно проставить по паре оценку от 1 до 5. Конечная цель для голосования «на той стороне», то есть для сайта — всё тот же выбор, верней — отбор, отсеивание говна и составление более-менее адекватных топов.

Цель голосования для пользователя же совсем другая, ибо выбора нет. Пользователь может всем оцениваемым сущностям поставить 5 баллов. Полный аналог «я хочу, чтобы все были президентами одновременно». Понятно, что ценность этих голосов равна нулю, и в чистом виде такое почти не встречается, но возможность проголосовать так есть.

Ограниченного ресурса («выбери одного») нет, поэтому мотивов расходовать его экономно (или разумно) тоже нет. Но хоть какие-то мотивы нужны, поэтому и включаются эмоциональные механизмы, которые к тому же бинарны: «понравилось/не понравилось».

Разграничивать «понравилось, но не очень», то есть ставить «четверку» вместо «пятерки», смысла тоже нет: «вам что, жалко, что ли?». Нет, не жалко. Мы — добрые! А вот если нас, таких добрых, разозлить...

С точки зрения голосования, как выбора, дискретность шкалы имеет значение: чем больше шкала, тем выше точность. Наиболее подходящая шкала — стобалльная (при этом надо понимать, что голосование, типа 7.5 — это тоже стобалльная шкала, которая к тому же понятно для пользователя приводится в десятибалльной).

С точки зрения людей и особенно социально взаимодействия, наиболее удобна бинарная шкала: гавно/конфетка.

И 75-95% людей будут сводить любую шкалу к бинарной.

Gamespot.com - почти идеальное голосованиеОтсюда промежуточный вывод: как ты шкалу ни назовешь, ее все равно будут использовать ровно одним способом, как только поймут, что в ней «хорошо», а что – «плохо».

Дискретная шкала просто имеет чуть больше смысла для 10% адекватных людей, которые будут использовать ее «идеологически верно». Еще один побочный эффект: чем больше делений у шкалы, тем больше шансов, что «щедрый» человек поставит 9.7/10 вместо 5/5: «это не так обидно».

Людей же, которые «голосуют сердцем», не пронять ничем, даже индивидуальной подписью к каждой оценке. У них все равно будет свой взгляд, «они так видят».

Налицо конфликт между авторами сайта и посетителями.

Наглядный пример: на картинке представлен результат разброса голосов на imdb.com по фильму «Крестный отец», который занимает первое место в top-250.

Видно, что 6% людей поставили фильму 1 из 10, то есть считают «Крестного отца» невероятным феерическим говном, после просмотра которого у них выпали глаза, случился самопроизвольный фимоз головного мозга и развилась патологическая боязнь кинематографа.

Очевидно, что это не так, даже чисто математически: далее график проседает аж до «семерки», и куда делись те люди, которые оценили фильм в промежутке от 1 до 7 — не понятно. Согласно математическим ожиданиям, их должно быть в разы больше.

Средний балл при этом у лучшего фильма всех времен и народов всего 8,7.

Конфликт «разруливается» элементарно: «one man, one vote» — принцип для наивных дураков, которого придерживаться не нужно.

То голосование, которое мы имеем на входе — это просто некие сырые статистические данные, которые нужно оценивать именно так — как данные. При этом вычисление среднего балла — наиболее нелепая вещь, которую можно сделать с этими данными. Средний балл не работает сразу (один проголосовавший), не работает и потом, потому что процент идиотов — величина постоянная, а бирки на них, увы, не развешены.

На imdb используется weighted vote averages:

IMDb publishes weighted vote averages rather than raw data averages. Various filters are applied to the raw data in order to eliminate and reduce attempts at ’vote stuffing’ by individuals more interested in changing the current rating of a movie than giving their true opinion of it.

The exact methods we use will not be disclosed. This should ensure that the policy remains effective. The result is a more accurate vote average.

Простым языком это значит только одно: «не все голоса одинаково полезны».

Возвращаясь к «Во всех голосованиях, типа +1/-1 должно быть на самом деле +N/-M, где N!=M (N не равно M)» это значит только одно: «есть гипотеза, что люди „опускают“ с большей охотой, чем „поднимают“ (или наоборот), если эта гипотеза верна, то собранные статистические данные полезней считать не как тупую сумму, а с применением веса».

То есть, почти всё то же самое, что написано выше, но применительно к бинарной системе.

Проблема в том, что бинарную систему сложнее нормализировать. Совсем условно говоря, в стобалльной системе мы можем смело считать людей, поставивших «один», откровенными ретардами, в бинарной системе нам для этого просто недостаточно данных.

С другой стороны, «голосование», типа +1/-1 — практически идеальный инструмент для «опускания», поэтому использовать его нужно именно так: как массовое коллективное опускание. «Мне карму заминусовали». Еще один плюс такого голосования состоит в том, что влияние одного человека является понятной константой, и понятно, «как с этим бороться». В отличие от голосования по N-балльной шкале и подсчете среднего балла.

На skill.ru, кстати, я испробовал примерно четыре разных системы (с кучей вариаций), в конце концов пришел к формулам, согласно которой помимо всего прочего голоса некоторых людей в крайних случаях вообще не учитываются, причем на основе их всех предыдущих голосов. То, что вес каждого голоса учитывается индивидуально — тоже очевидно. Причем ручного «бана» там нет, все подчиняются одним и тем же математическим правилам. Теперь топы, по крайней мере, можно смотреть без содрагания.

(Не знаю, почему до сих пор никто не реализовал «спарринговую» систему голосования: пользователю дается три-пять случайных работ, но примерно одинаковых по рейтингу работ, а он должен выбрать одну).

Таким образом, идеальная система голосования:

1. Предлагает не бинарную шкалу, главным образом для себя, но еще и для маленького процента нормальных людей.
(Пользователи говорят, что им «привычна» пятибалльная, но они просто врут, ее просто проще привезти к бинарной. На «серьезных» проектах я бы делал 100 балльную и приводил всё к виду 7.5/10).
2. Не навязывает пользователям трактовку этой шкалы (!).
3. Не обязана и не должна учитывать каждый голос одинаково.
4. Имеет закрытые механизмы подсчета конечного рейтинга.

PS.

Самое главное, о чем забыл написать подробно — подумал, что это и так очевидно: для чего нужно голосование, и что оно меряет.

Голосование меряет только человеческий интерес. И всё. Те, кто думают, что голосованием можно измерять качество — в лучшем случае заблуждаются. Если будет анонимно голосовать одна и та же группа экспертов по всем работам, при этом никак с этими работами не связанная, — тогда может быть.

Голосование измеряет популярность.

В этом плане десять «четверок» гораздо ценней, чем одна «пятерка», да и вообще, количество оценок — тоже релевантный фактор.

Польза для сайта от голосования абсолютно та же: предлагать на выходе список чего-то, что может понравиться среднестатистическому посетителю.

То есть всякие артхаус и прочее geekery — это не показательный пример вообще. Другое дело, что на основе все того же голосования можно сделать фичу, типа «люди, которые поставили этому фильму „пять“, так же поставили „пять“ следующим фильмам», — тогда это будет работать даже на примере артхауса.

Принцип, кстати, всё тот же: пользователю на входе дается N-балльная шкала, всё остальное — просто работа с данными.

Комментировать можно тут.

34
О! снова можно кричать, что раньше спектатор был лучше! Отлично!
Этот пост не показывается в гуглридере, но при этом гуглридер говорит, что в твоем фиде — одна непрочтенная запись. И даже нажатие «марк ол эз рид» не помогает :(
Superbizon81
Какова цель? Подтасовать голосование под мнение автора сайта?
kidd79, это гугл ридер колбасит последние пару недель — у него потерялась синхронизированность между списком фидов/папок и списком записей.

Обычно через минут 20–40 после появления записи в списке фидов она становится доступной для прочтения в списке записей.

jekyll
У нас на сайте журнала через два месяца после выхода номера выкладываются статьи. Эти статьи можно оценивать по десятибальной системе. Вот мысли, выросшие на основании наблюдений за процессом.

1. Часть людей всегда ставит «1». Всегда. Всем статьям. Потому что. Как результат, количество единиц для статьи зависит только от того, скольким мудакам она попалась на глаза. В конце концов решили просто не учитывать единицы при подсчете среднего балла. В социологии это называется вопрос-ловушка (точнее, так называл социолог в универе), то есть специальный фильтр для тех, кто хочет просто поприкалываться. Типичный пример — вариант ответа «у меня нет интернета» в онлайн-опросе о скорости доступа.

1а. О максимальных оценках того же сказать нельзя.

2. Как правило, образуется нормальное распределение оценок. Десятибальная шкала идеальна для оценки чего-либо, стобальная сводится к ней. Подчеркну — оценки, а не выбора.

3. (Продолжение пункта 2). Выбирать что-то лучшее можно двумя путями: либо предлагать оценивать каждое и сравнивать оценки, либо же предлагать полный список и давать выбор. В общем случае результаты разные, что очень интересно.

Superbizon81
> 6% людей поставили фильму 1 из 10, то есть считают
> «Крестного отца» невероятным феерическим говном

Может и правда считают. Например, не принимают пропаганду преступности. Или итальянцы, которым обидно, что их выставляют преступниками. Может этому фильму и в самом деле надо поставить 1.

Любые голосования везде — сферические кони в вакууме. Эти цифры практически ничего не говорят. Людям вообще не свойственно голосовать, потому что это, по-сути, прикладная задача ранжирования, которую обычный человек выполняет дай бог раз в месяц. Людям свойственно _выбирать_, а это подразумевает альтернативы или серии последовательных альтернатив.
Если же говорить о ранжировании, то всегда нужно учитывать кто именно ранжирует, в смысле соц.статус, возраст, пол, темперамент и т.п. считать результаты для каждого слоя, рисовать их на прозрачке, накладывать друг на друга и анализировать. Тот факт, что все 20-летние сцали кипятком от Годфатера, а все работники похоронных бюро отнеслись к фильму нейтрально (0 в -1/0/1, 5/10, 5.0/10.0) лишь говорит о том, как потенциально отнесётся представитель этой же группы к фильму, но никак не говорит, что в среднем люди оценивают этот фильм на 7.5. Это ложь, сферический вакуум — этот фильм никто так не оценивал/-ет.
Superbizon81
Другой пример — «17 мгновений весны». Да, снят профессионально и т. п. Но это же идеологическая бомба была. И может как раз стоит его оценить на 1. Или -100, если есть такая оценка.

Человек, ставящий 1 «популярному фильму» не обязательно не думает, что делает. Может как раз хорошо думает.

> Часть людей всегда ставит «1». Всегда. Всем статьям. Потому что.

Может быть на вашем сайте все статьи говно?

jekyll
> Может быть на вашем сайте все статьи говно?

Судя по тому, как их воруют, нет. Читайте внимательно: ЧАСТЬ людей :)

> Судя по тому, как их воруют
воруют любой уникальный контент, если на те-же киворды есть биды в pcc/контекстной реклами или других подобных клоаках.
vkv
>И может как раз стоит его оценить на 1
поздравляю тебя, супербизон, ты входишь в _те самые_ 75–95% людей
vkv
mrgatsby
>но никак не говорит, что в среднем люди оценивают этот фильм на 7.5. Это ложь, сферический вакуум — этот фильм никто так не оценивал/-ет.

а то, что все фильмы с имдб = 3 хуже чем фильмы имдб = 7, чистая случайность, это очевидно

vkv
а по-моему супербизон высказал 3 довольно неплохие мысли
"Ограниченного ресурса («выбери одного») нет, поэтому мотивов расходовать его экономно (или разумно) тоже нет. "

Ты никогда на «Хабре» не был?

И что там является ограниченным ресурсом?
На мой взгляд, рейтинг надо строить по принципу пирамиды. Коли уж бинарная система выбора наиболее удобна, то необходимо создать N точек входа, которые отвечают за цель рейтинга. Кастрированный пример — «Модерация фотографий» на Одноклассниках.
Каждая точка ставит «да/нет» и отправляет по своей «сети».
Каждая последующая точка может иметь только одну верхнюю.

Коли уж суть рейтинга — vox populi, внизу получаем охват, вверху — возможность его анализа. Снизу получаем 5 (например) ответов от 5 людей, которым доверили выбор. Вверх отсылаем «да-нет». Ведь по сути любой рейтинг — это маячок. Если мне 5 друзей скажут обратить внимание на что-то, то я обращу. Если 1 — то все будет зависеть от того, доверяю я этому человеку или нет. И если мне понравится, то мне останется вверх передать да\нет.

«Взломал университетскую базу данных и стал размещать на своем сайте фотографии студентов парами с призывом проголосовать, кто из двоих привлекательнее. За четыре часа на сайте побывало почти полтысячи пользователей.»
http://www.itogi.ru/Paper2008.nsf/Article/Itogi_2008_04_13_01_0026.html
Gaius Julius
> Не знаю, почему до сих пор никто не реализовал «спарринговую» систему голосования: пользователю дается три-пять случайных работ, но примерно одинаковых по рейтингу работ, а он должен выбрать одну

А что потом с этими данными делать? То что в идеале потом можно будет любые два объекта сравнить, еще не говорит о том что их можно будет отсортировать, скажем, для top10:

могут наголосовать так, что А > B, B > C, но C > A.

Там посто все: за каждую «победу» дается 1 балл. А потом сортируется по баллам.
«Да, таким образом, выйдет что смысл поста — не тупой копипаст, а собранные в одном удобном месте мнения по этому вопросу».

LOLOLOL

> Третий раз за год (!) обновился spectator.ru.

Приятная тенденция :)

vkv
debugman
3?! я насчитал одну: «я всеравно буду ставить колы, потому что мне нравится ставить колы.»
потому что если фильм оскорбляет твои религиозные чуства/является идеологической бомбой/снят режисером-педофилом/снят режисером, который всем твоим фоткам на однокласниках поставил единицы/, то это все не повод засорять рейтиг качества фильмов. Это, если тебя это действительно волнует и ты хочешь с этим боротся, повод написать в спортлото.
Плюсодин.
Superbizon81
> я всеравно буду ставить колы, потому что мне нравится
> ставить колы

хм, тебе надо перечитать. раза три, раз уж до тебя так плохо доходит. Смирнов говорит, что пример с Крестным отцом доказывает, что есть много людей, которые не думают, ставя оценки. я говорю, что эти люди как раз могут ставить оценки вполне осознанно и хорошо подумав, и оценив фильм как раз на кол. и не потому, что «им нравится ставить колы». а потому, что они ОЦЕНИВАЮТ фильм на кол.

> то это все не повод засорять рейтиг качества фильмов

это почему же гавно нельзя оценивать как гавно? т. е. фильм гавно, а в рейтинге он должен конфеткой выглядеть, так по твоему?

vkv
>т. е. фильм гавно, а в рейтинге он должен конфеткой выглядеть, так по твоему?
ну, очевидно потому что он не гавно. Как какой-нибудь звездная пыль, я-легенда, и что там еще. Он просто обижает итальяшек и популяризует криминал.
Но ведь создатели рейтинга срашивали не об этом?
---
если так не понятно, я понятее объясню: пусть есть сайт с разноцветными прямоугольниками, их которых нужно выбрать самый большой, самый чуть меньше большого, и так далее до самого маленького. ты же предлагаешь ставить всем фиолетовым 1, потому что они фиолетовые.
> а то, что все фильмы с имдб = 3 хуже чем фильмы имдб = 7, чистая случайность, это очевидно
Во-первых, не все. Это не закономерность, это чистая случайность лол.
Во-вторых, у некоторых артхаузных фильмов там ВООБЩЕ нет рейтинга, потому что большинство людей артхаус считает изъёбством.
В-третьих, если человек любить артхаус, он вынужден искать свои, артхаусные рейтинги, потому что рейтинги имдб для него — полный крэп.
Это так, для примера.

Загадка для самых умных. Если у Smultronstallet на imdb 8,3, а у La Dolce Vita — 8,1. Smultronstallet > La Dolce Vita? И зачем мне знать эти цифры, что они мне дают?

jkmax
все изъебы с голосованиями лишены смысла?
Ну вот я смотрю (когда смотрю) фильмы двух категорий: обобщенный артхауз и обобщенный треш (от Plan 9 from Outer Space/Faster, Pussycat, Kill, Kill! до гарипотырь/Star Wars/Властелин колец). Все остальное считаю унылым говном и больше 2/10 вряд ли поставлю, а Крестному отцу еще бы и снизил за занудство и пафосность. Несколько раз оказывался в зоне поражения Крестным отцом и ни разу не высидел больше 10 минут — чем это не 1/10?
vkv
(людо, бешенно орет) 75–95%! 75–95%!! Социотпатить и мизатропировать!!!111
(грустит и уходит)
75% — это оптимистично.
Да похеру, как кто видит аудиторию пользовтелей imdb — проблема в том, что никто, из пользующихся голосованием, НЕ ЗНАЕТ какая она. Я не согласен быть даже в 99% с 16-летними дрочерами. Я не согласен пользоваться их рейтингами. Я не согласен с их моар акшн, лесс кью кью.
И даже если это всё похуй, зачем мне нужны эти цифры, если всё сводится к «< 3" - трэш, "> 7» — суперрулез, офисная тля бугогакала всем офисом, а между ними — ХЗХЗ. Это ДВЕ оценки, если что, а никакая не стобальная шкала. А если кому-то вдруг случится действительно сравнивать фильмы, пользуясь рейтингом imdb количественно — он идиот, sorry :(
лол, кавычки и стрелочки свели движок Смирнова с ума.
Я НАШЁЛ БАГ! Я ХАКНУЛ Р2!
2 mrgatsby
Не ты — первый, не ты — последний
Superbizon81
> ну, очевидно потому что он не гавно.

«Сердцем чуешь», а все другие неправы? Почему не гавно то? Какие критерии, кроме твоей «интуиции»?

> Он просто обижает
> итальяшек и популяризует криминал.

Просто говно :)

> Но ведь создатели рейтинга срашивали не об этом?

Создатели рейтинга попросили — «оцените фильм, пожалуйста». Человек оценил. Чем ты не доволен, что с твоим мнением не совпадает?

Superbizon81
> все другие неправы

Я имел в виду все с резко отличающимся мнением неправы по vkv. Почему — он объяснить не может.

> есть сайт с разноцветными прямоугольниками, их которых нужно
> выбрать самый большой,

неверная аналогия. размер — четкий критерий. с фильмами требуется оценить хороший или плохой.

Lissome
Насчет спарринговых голосований. Натыкался я в просторах интернетов на сайт с голосованием по фоткам котят. Даются две фотки. Кликаешь на ту что нравится, выдается следующая пара. Фотки все любительские. Давно было, ссылку дать не могу.
У меня есть предположение, что в квазинепрерывной шкале (например, привычного нам уже вида 7.5/10) *все* крайние оценки являются следствием излишне эмоционального отношения к оцениваемой сущности (в противовес рациональному). Попытка выставить «справедливую» оценку обычно не приводит к крайностям — конечно, если сущность на самом деле не навоз или не жемчужина в куче навоза ;-), или друг не попросил проголосовать за него ради победы в конкурсе (вот, кстати, тоже источник накруток, который я лично люто, бешено ненавижу во всех проявлениях — 0/10).

Что будет, если вес оценки будет зависеть от ее близости к краям шкалы? Например, вес оценки для шкалы [0,a]
w=1-((x/a-1/2)^2n)×2^2n-δ,
где nєN — некоторая мера строгости фильтрации,
δ→0 — степень отсева крайних значений?

При этом и говно можно потопить нулевыми оценками (если все голосуют одинаково, вес уже не имеет значения), и шедевр отметить. А попытки накруток станут практически невозможными, если правильно подобрать n и δ.

Есть рациональное зерно?

Пардон, формулу читать как w=1-((x/a-1/2)^2n)×2^(2n-δ), конечно.
Привет, Anonymous! Чтобы оставлять комментарии, надо авторизоваться.