vryadli: (Default)
[personal profile] vryadli
из комментов - мне было интересно.:

Но предыдущий по смыслу огрызок скорее:
"The Singulyarity is Near". Достаточное о сингуляриях.



exceeder
гранты, гранты... люди занимаются всякой фигней, потому что хотят удовлетворять свои потребительские и материалистичные наклоноости. А деньги, кто не в курсе, бегут туда, где самое яркое шоу (это я после некоторого анализа успеха венчурного капитала и недавнего первого визита в Лас Вегас так размышляю)


Вот взять, к примеру, информационное пространство современных сетей. Оно же практически все управляется ограничениями реляционной алгебры. И даже это часто слишком сложно, поэтому - Гугл. С одним единственным, вообще даже неструктурированным, способом поиска. Реально же это все морально устарело. Это как попытка натянуть презерватив на глобус. Реляционная алгебра имплеметировалась в поиск по базам данных из расчета до нескольких сотен тысяч унифицированных записей. Индексирование текстов - для поиска внутри потока символов с разделителями. Мы же буквально имеем глобус, соединенный переплетением сетей. И ищем пылинки, имея в руках лопату дачную обыкновенную. Ну и иногда еще бульдозер. Революция кажется неизбежной. Но меркантильные интересы сил, движущих интернет, не хотят слышать об инвестициях в то, чего они даже не понимают, а речь идет о реструктуризации уже существующих информационных систем.

Яркий пример - Майкософт и WinFS, объектная фалйовая ситема, кажущийся мммаааленький, ну же шажок в нужном направлении, да еще где - в сердце самой популярной ОС. Увы, исключен из списка фич. Ибо решатели с деньгами так и не поняли, что за этим стоит.

Возьмем какой-нибудь Гугляндекс, и наберем "Вася" (надеюсь, ни у кого не возникает возражений, что это основной способ найти информацию в Сети?). Что мы реально получаем? Список линков на документы (для простоты сайты будут документами): "Вася Пупкин - наш медвед и превед!", "О морфологии имени Василий" и какой-нибудь "Меня теперь любят Петя, Вася и Коля. Я жутко счастлива, что купила бигуди с нейропрограммированием реинкарнации личностных характеристик фирмы Лохматим Лохов Ltd."
Когда эта информация была обновлена? А когда создана? Какой стилистики и содержания я могу ожидать? Есть ли в текстах скрытые цитаты? Откуда они? Кто ссылается на них? Есть ли там иллюстрации? Мультимедиа? - ну это просто.
Есть ли в географической близости от документа А еще документы такого же содержания? Связаны ли они одним корпоративным образованием?

Можно продолжать и продолжать... А ведь вся эта информация где-то есть явно, или приблизительно может быть прикинута. Я уже молчу, что огромное количество нужной информации недоступно из-за чувствительности содержимого и колпака безопасности на нем. Вот тут наступает действительно сложная математика и задачи - как находить и извлекать информацию из интернета, защищенную от несанкционированного доступа, не нарушая этих прав, но допуская доступ там, где он обоснован (сбор статистики, какие-то правовые условия типа врачебной необходимости, и т.д.)

Этого всего нет не потому, что в Гугляндексах безрукие программеры. Отнюдь. Там работают очень грамотные и сильные ребята. Полируя алгоритмы, созданные первыми библиотекарями на заре цивилизации. Это инертность среды... нашей экосистемы. Проблема одной серии со, скажем, невозможностью транспорта на водороде из-за отсутствия инфраструктуры (а точнее, присутствия другой, бензиновой).

С другой стороны, я верю, что дал сейчас несколько штрихов интернета через 5-10 лет.

aquercus
Честно говоря, мне современные поисковики не нравятся. Они, конечно, намного лучше, чем без них, но почему-то вызывают из памяти образы древних орудий наших далёких предков..очень грубые.
А вот скажите..правда ли, что алгоритмы поиска таковы, что "наверху" оказываются наиболее посещаемые в сети места на заданную тему?

exceeder
Нет, не правда. Но там, безусловно, есть корелляция. Сейчас обьясню. Каждый поиск слова в документе возвращает не "есть/нету", а рейтинг. Обычно число между 0 и 1. Документы с самым высоким рейтингом оказываются вверху. Более высокий рейтинг обычно определяется количеством ссылок на документ. К примеру, если в разных местах в инернете будет написано "классненький гуляш у Васи тут", "пробовал сделать этот гуляш - ничо так", "от гуляша сносит крышу" - и все эти фразы будут находится рядом с линком на сайт guliash.info - то скорее всего этот сайт получит высокий рейтинг относительно слова "гуляш".

Именно так создавались интернетные флэш-мобы. Когда тысячи людей пишут у себя на сайтах "придурок" и дают ссылку на Буша, то личный сайт Буша вдруг начинает отзываться на слово "придурок", причем с высоким рейтингом.

А посещаемость - вторична. Если на сайт существует много линков, да к тому же он высоко в рейтингах поисковиков, естественно на него будут ходить много людей.

vryadli
очень интересно. Как-то кк жизнь сложилась, что в вэтой области, поиск и сортировка я ни черта не знаю.
То есть в Вашем рассказе две темы - одна насчет проблемы серезных инноваций. Это очень занятно, по тому что очень схожую проблему я числю в причинах распада СССР.
Второе - что можно и что стоит ( с том смысле, что он реально сумеет использовать) человеку хотеть для обращения инфой. Как изменять само думанье, по мере того, как возмжности обобщения и анализа инфы увеличиваются.





А кстати, может кто-нибудь знает пpиличные книжки уровня примерно "Первых трех секуд" по информатике в самом широком смысле этого слова? Tипа черненького Окуня (крючков побольше)тоже сойдет.
This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

Profile

vryadli: (Default)
vryadli

January 2026

S M T W T F S
    123
45678910
111213 14 151617
18192021222324
25262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 20th, 2026 01:22 pm
Powered by Dreamwidth Studios