egorick ([info]egorick) wrote,
@ 2008-07-08 13:26:00
Previous Entry  Add to memories!  Tell a Friend  Next Entry
Current mood: energetic

жизнь в хаосе
Если работаешь в Google, невозможно обойти стороной красивую сказку о "Page Rank". Не так давно какой-то мужик по фамилии Пейдж придумал, что научная статья будет тем важнее, чем больше на неё ссылок из других статей. Дополнив "важность" до линейного порядка её стали называть "Page Rank" или "Индексом цитируемости". И это оказалось удобно.

Ходит слух, что PageRank был назван в честь того самого Пейджа. Тогда, соответственно, термин следует перевести как "Ранжирование Пейджа".

Допустим, какой-то учёный ищет статью по ключевым словам. Если перед выдачей всех результатов их отсортировать в порядке убывания "важности", то ищущему будет "казаться", что поиск очень "умный" и ищет "то, что надо". Можно напридумывать много разных модификаций PageRank, например, учесть, что ссылки маститого автора более важны, чем ссылки никому неизвестных. И поисковая машина станет ещё "умнее".

Идея до сих пор не слишком глубоко вжилась в научные круги. Нет, конечно, есть несколько хороших поисковиков по научным статьям, но среди учёных до сих пор абстрактная крутизна оценивается издательствами, в которых публикуются работы, а не индексом цитируемости. Вся научная воля была скуплена жадными издательствами. Ну и ладно, не помогло учёным, зато хорошо помогло интернету вырасти и "улучшиться".

От предисловия к новизне. Тут подумалось, что идею PageRank можно применить в какой-нибудь другой области. Например, в качестве двигателя карьерного роста в больших компаниях. Вот представьте картину: всех, кто устраивается на работу в компанию X, бросают в хаотичную среду, где они могут делать что хотят, но будут оценены соответственно своему личному PageRank. Сделаешь много полезного, о тебе хорошо скажут, чем более толстые перцы скажут, тем лучше, ну или хуже, если отзыв негативный.

Кажется, такая схема управления позволит дёшево получить устойчивую и, в то же время гибкую, саморегулирующуюся систему, в которой работники делают важные вещи либо уходят.

Однако, чем глубже в лес, тем толще партизаны. Во-первых, надо добиться того, чтобы информация о работе каждого человека была открыта любому, также, как и информация об отзывах. Иначе люди, работающие над "сверхсекретными" проектами окажутся дискриминированными. Очевиден недостаток системы в том, что для работы в таком хаосе люди тоже должны быть определённого ..мм.. хаотического склада, не слишком часто встречающегося в реальной жизни. Далее, важно, чтобы среди работников была критическая масса людей, занимающихся делом, а не созданием лжеотзывов. Реалистично оценить величину этой критической массы у меня не получается. Обидно. Не социальный инженер.

Недостатков можно найти много, но ведь нам не нужна идеальная система, правильно?

Как вы уже, наверное, догадались, работа в Google устроена почти так. Как раз для меня тут недавно нашлась неплохая такая ниша, только теперь придётся бегать по всему спортзалу, искать толстых перцев, "продавать" им свою нишу за отзывы...

Чорт. Ушол месить хаос.

P.S.: Справедливости ради следует отметить, что не во всём Гугле жизнь настолько хаотична. Некоторые куски самоорганизовались в более традиционные иерархично-плановые организации. Не знаю, заставлял ли их кто-нибудь это делать. Динозавры непознаваемы.

Upd: Как верно подмечает [info]itman, ссылочный анализ был придуман до Пейджа. Википедия даже говорит, что это сделал Eugene Garfield в 50-х. Пейдж даже не изобрёл применение ссылочного анализа к Вебу, что было до него выдумано в лабораториях IBM. Пейдж запатентовал один из алгоритмов ссылочного анализа. И не побоялся со-организовать компанию с несуществующей монетизацией.




(34 comments) - (Post a new comment)


[info]gaus
2008-07-08 09:40 am UTC (link)
PageRank - технология прошлого века.

Это не саморегулирующаяся система, а самонакачивающася. Новые ссылки получают только те статьи, на которые уже есть ссылки, поскольку только они находятся в первую очередь поисковой системой. В итоге "богатые богатеют, бедные беднеют"

Кстати, в статьях гуглеров на research.google.com этот эффект упоминается.

Но лучше всё равно никто пока ничего не придумал. Так что стартовая площадка для захвата мира свободна :)

(Reply to this) (Thread)


[info]egorick
2008-07-08 07:19 pm UTC (link)
я верю в тот факт, что нахождение хорошей идеи не способствует захвату мира. Способствует вера в неплохую идею. Как ни странно.

(Reply to this) (Parent)(Thread)


[info]gaus
2008-07-09 05:13 am UTC (link)
Ит из э мэттер оф нейминг.

На pre-seed cтадии единственный критерий "хорошести" - это вера. Такой вот web2.0-бердяев.

(Reply to this) (Parent)(Thread)


[info]egorick
2008-07-09 05:57 am UTC (link)
IMHO, излишний субъективизм в понятии хорошести. Ну да ладно, понимание установлено.

(Reply to this) (Parent)


[info]nskboy
2008-07-08 11:02 am UTC (link)
Слушай, прекрасное описание жизни. Не могу не согласиться :)

(Reply to this) (Thread)


[info]egorick
2008-07-08 07:22 pm UTC (link)
ага, и ад, как всегда, в деталях)

(Reply to this) (Parent)


[info]mr_aleph
2008-07-08 11:18 am UTC (link)
я еще число Эрдоша вспоминаю =)

(Reply to this) (Thread)


[info]egorick
2008-07-08 07:22 pm UTC (link)
первый раз про него слышу, забавная история, спасибо :)

(Reply to this) (Parent)


[info]otmenych
2008-07-08 11:55 am UTC (link)
«Самоорганизующаяся» система типа habrahabr.ru превратилась в заповедник непуганого конформизма. Так что нахер нахер систему оценки всех всеми. Говно неизбежно всплывёт.

(Reply to this) (Thread)


[info]egorick
2008-07-08 07:16 pm UTC (link)
вопрос в деталях оценки. И прочих процессах, сопровождающих всплывание. Да и что греха таить, у гугла всплывает разное...

на хабре тусуюсь мало, он выглядит для меня и вправду странновато...

(Reply to this) (Parent)(Thread)


[info]otmenych
2008-07-08 07:25 pm UTC (link)
Вопрос даже не в деталях оценки, а в простом человеческом факторе. Грубо говоря, если все вокруг честные и беспристрастные, то и оценки будут адекватные. А если двуглазое ходячее говно, как в большинстве самоуправляющихся сайтов, то ничего хорошего не получится. Как пример (помимо хабра, лепры и прочего) — русская википедия. В английской говно вегетарианское, поэтому по поверхности не плавает, поэтому не так заметно.

(Reply to this) (Parent)(Thread)


[info]egorick
2008-07-08 07:42 pm UTC (link)
> если все вокруг честные и беспристрастные

все -- необязательно, важна критическая масса, и необязательно беспристрастных, а заинтересованных в получении чего-то полезного, скажем, общей прибыли.

(Reply to this) (Parent)


[info]takoi
2008-07-08 01:16 pm UTC (link)
> Допустим, какой-то учёный ищет статью по ключевым словам. Если перед выдачей всех результатов их отсортировать в порядке убывания "важности", то ищущему будет "казаться", что поиск очень "умный" и ищет "то, что надо". Можно напридумывать много разных модификаций PageRank, например, учесть, что ссылки маститого автора более важны, чем ссылки никому неизвестных. И поисковая машина станет ещё "умнее".

Можно сделать персональным: читатель сам определяет авторитетность автора.
Учитывать не только прямые ссылки, но и обратные, на какие работы ссылается данная работа.

Станет лучше :) Например (придуманный), мне некоторые тысячники в ЖЖ совсем не нравятся, считаю что нравится это может людям с извращенным вкусом, и не хотел бы чтобы мнение тех кто их читает учитывалось при поиске ЖЖ френдов.

(Reply to this) (Thread)


[info]egorick
2008-07-08 07:21 pm UTC (link)
классная идея персонализованного поиска! не сомневаюсь, что она уже приходила в голову многим людям.. надо внедрять :)

(Reply to this) (Parent)


[info]itman
2008-07-08 03:17 pm UTC (link)
Это неправда, что ссылочное цитирование придумал Page. Он придумал (и то не факт, что это было уникальное изобретение) всего-навсего еще один алгоритма подсчета ссылочной значимости.

(Reply to this) (Thread)


[info]egorick
2008-07-08 07:13 pm UTC (link)
спасибо!

(Reply to this) (Parent)


[info]ens_a_se
2008-07-08 05:40 pm UTC (link)
Я знаю как работает ссылочный механизм в научных статьях (именно из-за этого приходится как-то там верно оформлять списки литературы видимо). Но вот как такое можно перенести на менеджмент я понять не смог. Бывает типо бальная система когда за каждое задание и его исполнение человеку дается н-ое кол-во баллов и по результатам за месяц платят -- это то, нет?

(Reply to this) (Thread)


[info]egorick
2008-07-08 07:21 pm UTC (link)
совсем не то :)

(Reply to this) (Parent)(Thread)


[info]ens_a_se
2008-07-08 08:36 pm UTC (link)
Ну, значит я совсем не понял в чём фишка

(Reply to this) (Parent)(Thread)


[info]egorick
2008-07-09 05:56 am UTC (link)
1. оценивать реже, чем за месяц, выставляя планку зарплаты (и уровень ответственности, может быть)
2. важно, как высчитывать кол-во баллов, если на основе собрания вольных отзывов сотрудников друг на друга, то получается приблизительно то, что я имел ввиду

(Reply to this) (Parent)


[info]eugenebo
2008-07-08 11:32 pm UTC (link)
Как и с поиском в интернете :), система, основанная на количестве отзывов, подвержена проблеме спама. Страница, всеми правдами и неправдами получающая на себя ссылки, вовсе не обязательно окажется чем-то хорошим. Так же и с людьми: борцы за visibility тратят 100% своих усилий не создание полезного, а на коллекционирование отзывов.

Не то чтобы система вообще не работала, кто бы спорил. Но данная неустойчивость серьёзно подрывает её применимость в любом долгоживущем деле.

(Reply to this) (Thread)


[info]egorick
2008-07-09 05:52 am UTC (link)
надо отметить, борцы за визибилити досаждают и в компаниях традиционного вида. И компании-менеджерские-лестницы не отрицают, что надо бороться за визибилити. А ведь обмануть своего менеджера гораздо проще, чем толпу специалистов.

(Reply to this) (Parent)


[info]artitz
2008-07-09 01:34 pm UTC (link)
Скинь смс или позвони плиз, у меня не оказалось твоего московского номера.

(Reply to this)


[info]esycat
2008-07-10 05:18 pm UTC (link)
Про научные издательства пассаж странный. В научной сфере, как и в других по очевидным причинам бюрократизированных областях, всё устроено и работает на схожих механизмах, просто выборка ограничена и применяется квалифицированная ручная обработка.

(Reply to this) (Thread)


[info]egorick
2008-07-10 08:25 pm UTC (link)
Пассаж к тому, что данная конкретная бюрократия решает не очень сложную и хорошо автоматизируемую задачу. Решает её совсем не точно, при этом долго и дорого. Я не предлагаю ничего конкретного, но в такой ситуации мировое научное сообщество меня поражает своей беспомощностью :)

Причины бюрократизированности здесь, мне кажется, не столь очевидны. История долгая и запутанная.

(Reply to this) (Parent)(Thread)


[info]esycat
2008-07-10 10:22 pm UTC (link)
Такие области как наука, медицина, право имеют слишком большую значимость и стоимость ошибок. Поэтому высокий уровень бюрократизированности и закрытости необходим. Далеко не всё устроено разумно, но как всегда и везде найти несуществующую золотую середину просто невозможно.

Ценность статей и авторитетность авторов определяется на основе именно индекса цитируемости. А научные издательства служат учитывающимися при ранжировании специализированными площадками для размещения материала. Схожую функцию ручного ограничения выборки выполняют сервисы Google Health и Google Co-op — как-то не удалось поисковому гиганту обойтись автоматизированными системами.

Дорого и долго — в сравнении с чем? Блогами и бульваной прессой? Так вернёмся снова к значимости и стоимости ошибок.

(Reply to this) (Parent)(Thread)


[info]egorick
2008-07-11 12:59 pm UTC (link)
Не соглашусь.

Большое количество статей, выходящих в печать, содержат ошибки. Иногда поражаюсь, как их много. Такое впечатление, что их специально допускают, чтобы усложнять жизнь конкурентам. Таким образом, стоимость ошибок в науке практически равна нулю.

Открытость -- это одна из основных движущих сил науки. Конференции, обмен опытом, статьи. Традиционно, научное сообщество своими основами упирается в принципы открытости. Даже во времена железного занавеса открытое общение учёных не смогли вполне остановить. Как только науку начинаешь замыкать в рамки закрытых лабораторий, она начинает умирать.

Золотую середину найти невозможно, это правда. Но сделать адекватную и не слишком навороченную социальную сеть вполне возможно. Есть сппециальные области науки, занимающиеся подобными проблемами. Таким образом, учёные себя сейчас ведут как сапожники без сапог.

> Дорого и долго — в сравнении с чем?

социальные сети? digg? habrahabr?

(Reply to this) (Parent)(Thread)


[info]esycat
2008-07-11 03:00 pm UTC (link)
Открытость общения и обмена опытом вообще никак не пересекаются с закрытостью клуба как такового. Чтобы получить статус известного и авторитетного специалиста необходимо совершить определённый путь и иметь реальные заслуги.

Существуют механизмы ранжирования с учётом значимости референтов. По сути получается именно социальная сеть.

Высокий рейтинг на Хабре — неплохой показатель общественного признания, но совершенно неспособен гарантировать высокого профессионализма в интересующей области. PageRank построен на том же принципе «миллион мух не могут ошибаться».

А вот попасть на глянцевые страницы PNAS сможет только очень качественный материал. Причём решение о публикации принимается вовсе не «жадным издательством», а на основе отзывов до десятка независимых рецензентов известных в той же или смежных научных областях. Так или иначе ошибки существуют везде, но сравнивать серьёзность и ценность материала со средней температурой на Хабре просто невозможно.

Давать же серой массе возможность оценивать статьи, смысл которых способны понять несколько сотен человек на планете абсолютно бессмыслено.

(Reply to this) (Parent)(Thread)


[info]egorick
2008-07-11 05:59 pm UTC (link)
Хорошо, серой массе не будем давать оценивать, делов-то.

Мне, как учёному, совершенно не нужен глянцевый PNAS, мне необходимо находить нужную информацию быстро и бесплатно. И я, как учёный, должен иметь возможность публиковать свои результаты максимально быстро, так, чтобы их могло увидеть как можно больше людей (и оперативно исправить). Чем не Open Source?

(Reply to this) (Parent)(Thread)


[info]esycat
2008-07-12 02:38 am UTC (link)
мне необходимо находить нужную информацию быстро и бесплатно
Существуют огромные электронные библиотеки с хорошим поиском и выборками по множеству параметров, ранжированием, перекрёстными ссылками, актуальной необходимой информацией об авторах и организациях.

Для постороннего посетителя многие их этих архивов не бесплатны, а иногда вообще недоступны. Но это и есть закрытость клуба. Если работаешь на науку, то у тебя есть доступ ко всему необходимому за счёт компании.

возможность публиковать свои результаты максимально быстро, так, чтобы их могло увидеть как можно больше людей
Такой потребности в настоящее время просто не существует, на сколько могу судить. Мир науки крайне нетороплив. Результаты могут оставаться актуальными многие годы и даже десятилетия. Время, необходимое на подготовку, рецензирование, корректирование и публикацию вполне оправданы и приемлемы.

Ещё, кстати, у научных изданий есть Impact Factor, который потом тоже учитывается для автора. Социальная сеть во всей красе. А за публикацию материала авторам деньги платят — сильно больше, чем AdSense сможет позволить.

Постепенно интернет наверняка получит большее значение, но оптимизировать скорость, стоимость и сам процесс без снижения качества не получится. Система отлажена временем и хорошо работает. Говорить о «сапожниках без сапог» можно только от незнания, как всё это устроено.

(Reply to this) (Parent)(Thread)


[info]egorick
2008-07-12 08:24 am UTC (link)
Если работаешь на науку, то у тебя есть доступ ко всему необходимому за счёт компании.

зачем такая закрытость? это деньги, выбрасываемые международным сообществом на ветер.

Мир науки крайне нетороплив.

да, зачем нам дороги с твёрдым покрытием? по ухабистым дорогам ездят крайне неторопливо.

А за публикацию материала авторам деньги платят

это глупо. Они публикуются, чтобы стать известными. Им не нужно платить.

оптимизировать скорость, стоимость и сам процесс без снижения качества не получится

качество мировой еауки и без того в жуткой заднице. Можно бесконено говорить, что оно "хорошо работает", но если есть очевидные механизмы, как работу значительно улучшить (ускорив обмен информацией, например), не означает ли это, что система работает хорошо только по меркам прошлого века, или даже позапрошлого?

Говорить о «сапожниках без сапог» можно только от незнания, как всё это устроено.
безусловно, наука в разных отраслях устроена по-разному. Я видел лишь маленькую крошку огромной печеньки. Наверное, какую-то нехарактерную крошку, потому что поперёк горла встала.

(Reply to this) (Parent)(Thread)


[info]esycat
2008-07-12 10:00 am UTC (link)
зачем такая закрытость? это деньги, выбрасываемые международным сообществом на ветер.
Почему бы Гуглу не открыть исходники всей своей поисковой системы? Вероятно потому, что это коммерческая тайна и непосредственный источник доходов компании.

Деньги никто никуда не выбрасывает. Или платить за использование электронного сервиса уже совсем моветон теперь считается?

да, зачем нам дороги с твёрдым покрытием? по ухабистым дорогам ездят крайне неторопливо.
Помню, смотрел некогда видео-ролик с рассказом о рабочем дне в Гугле. Там говорилось, если не ошибаюсь, что каждый кусок кода перед коммитом должен быть отревьювлен как минимум двумя коллегами. Это, по всей видимости, тоже одна из имплементаций ухабистой дороги. Почему бы не позволить каждому сотруднику в любой момент нажимать ту магическую кнопочку, которая деплоит изменения на все боевые серверы? Думаю, это бы многократно ускорило процесс разработки и обмен информации между сотрудниками внутри компании! В основном, конечно, сугубо матерной информации…

Существует множество совершенно объективных технологических и менее объективных организационных причин, совместными усилиями серьёзно замедляющими всю работу. Цена ошибок очень высока.

качество мировой еауки и без того в жуткой заднице,
Ну, если смотреть критически, то весь мир в глубокой заднице. Большинство организационных проблем наверно во всех областях упираются сначала в самих людей, а не отсутствие технических решений. Это уже какие-то вопросы философии и психологии.

(Reply to this) (Parent)(Thread)


[info]egorick
2008-07-12 10:16 am UTC (link)
OK, то есть, мы разделяем мнение, что кое-что упёрлось в кое-каких людей? уже хорошо :)

(Reply to this) (Parent)(Thread)


[info]esycat
2008-07-12 10:27 am UTC (link)
Как уже сказал, это верно для любой области, а не для «кое-какой».

(Reply to this) (Parent)


(34 comments) - (Post a new comment)

Create an Account
Forgot your login or password?
Login w/ OpenID
English • Español • Deutsch • Русский…