из комментов - мне было интересно.:
Но предыдущий по смыслу огрызок скорее:
"The Singulyarity is Near". Достаточное о сингуляриях.
exceeder
гранты, гранты... люди занимаются всякой фигней, потому что хотят удовлетворять свои потребительские и материалистичные наклоноости. А деньги, кто не в курсе, бегут туда, где самое яркое шоу (это я после некоторого анализа успеха венчурного капитала и недавнего первого визита в Лас Вегас так размышляю)

Вот взять, к примеру, информационное пространство современных сетей. Оно же практически все управляется ограничениями реляционной алгебры. И даже это часто слишком сложно, поэтому - Гугл. С одним единственным, вообще даже неструктурированным, способом поиска. Реально же это все морально устарело. Это как попытка натянуть презерватив на глобус. Реляционная алгебра имплеметировалась в поиск по базам данных из расчета до нескольких сотен тысяч унифицированных записей. Индексирование текстов - для поиска внутри потока символов с разделителями. Мы же буквально имеем глобус, соединенный переплетением сетей. И ищем пылинки, имея в руках лопату дачную обыкновенную. Ну и иногда еще бульдозер. Революция кажется неизбежной. Но меркантильные интересы сил, движущих интернет, не хотят слышать об инвестициях в то, чего они даже не понимают, а речь идет о реструктуризации уже существующих информационных систем.
Яркий пример - Майкософт и WinFS, объектная фалйовая ситема, кажущийся мммаааленький, ну же шажок в нужном направлении, да еще где - в сердце самой популярной ОС. Увы, исключен из списка фич. Ибо решатели с деньгами так и не поняли, что за этим стоит.
Возьмем какой-нибудь Гугляндекс, и наберем "Вася" (надеюсь, ни у кого не возникает возражений, что это основной способ найти информацию в Сети?). Что мы реально получаем? Список линков на документы (для простоты сайты будут документами): "Вася Пупкин - наш медвед и превед!", "О морфологии имени Василий" и какой-нибудь "Меня теперь любят Петя, Вася и Коля. Я жутко счастлива, что купила бигуди с нейропрограммированием реинкарнации личностных характеристик фирмы Лохматим Лохов Ltd."
Когда эта информация была обновлена? А когда создана? Какой стилистики и содержания я могу ожидать? Есть ли в текстах скрытые цитаты? Откуда они? Кто ссылается на них? Есть ли там иллюстрации? Мультимедиа? - ну это просто.
Есть ли в географической близости от документа А еще документы такого же содержания? Связаны ли они одним корпоративным образованием?
Можно продолжать и продолжать... А ведь вся эта информация где-то есть явно, или приблизительно может быть прикинута. Я уже молчу, что огромное количество нужной информации недоступно из-за чувствительности содержимого и колпака безопасности на нем. Вот тут наступает действительно сложная математика и задачи - как находить и извлекать информацию из интернета, защищенную от несанкционированного доступа, не нарушая этих прав, но допуская доступ там, где он обоснован (сбор статистики, какие-то правовые условия типа врачебной необходимости, и т.д.)
Этого всего нет не потому, что в Гугляндексах безрукие программеры. Отнюдь. Там работают очень грамотные и сильные ребята. Полируя алгоритмы, созданные первыми библиотекарями на заре цивилизации. Это инертность среды... нашей экосистемы. Проблема одной серии со, скажем, невозможностью транспорта на водороде из-за отсутствия инфраструктуры (а точнее, присутствия другой, бензиновой).
С другой стороны, я верю, что дал сейчас несколько штрихов интернета через 5-10 лет.
aquercus
Честно говоря, мне современные поисковики не нравятся. Они, конечно, намного лучше, чем без них, но почему-то вызывают из памяти образы древних орудий наших далёких предков..очень грубые.
А вот скажите..правда ли, что алгоритмы поиска таковы, что "наверху" оказываются наиболее посещаемые в сети места на заданную тему?
exceeder
Нет, не правда. Но там, безусловно, есть корелляция. Сейчас обьясню. Каждый поиск слова в документе возвращает не "есть/нету", а рейтинг. Обычно число между 0 и 1. Документы с самым высоким рейтингом оказываются вверху. Более высокий рейтинг обычно определяется количеством ссылок на документ. К примеру, если в разных местах в инернете будет написано "классненький гуляш у Васи тут", "пробовал сделать этот гуляш - ничо так", "от гуляша сносит крышу" - и все эти фразы будут находится рядом с линком на сайт guliash.info - то скорее всего этот сайт получит высокий рейтинг относительно слова "гуляш".
Именно так создавались интернетные флэш-мобы. Когда тысячи людей пишут у себя на сайтах "придурок" и дают ссылку на Буша, то личный сайт Буша вдруг начинает отзываться на слово "придурок", причем с высоким рейтингом.
А посещаемость - вторична. Если на сайт существует много линков, да к тому же он высоко в рейтингах поисковиков, естественно на него будут ходить много людей.
vryadli
очень интересно. Как-то кк жизнь сложилась, что в вэтой области, поиск и сортировка я ни черта не знаю.
То есть в Вашем рассказе две темы - одна насчет проблемы серезных инноваций. Это очень занятно, по тому что очень схожую проблему я числю в причинах распада СССР.
Второе - что можно и что стоит ( с том смысле, что он реально сумеет использовать) человеку хотеть для обращения инфой. Как изменять само думанье, по мере того, как возмжности обобщения и анализа инфы увеличиваются.
А кстати, может кто-нибудь знает пpиличные книжки уровня примерно "Первых трех секуд" по информатике в самом широком смысле этого слова? Tипа черненького Окуня (крючков побольше)тоже сойдет.
Но предыдущий по смыслу огрызок скорее:
"The Singulyarity is Near". Достаточное о сингуляриях.
exceeder
гранты, гранты... люди занимаются всякой фигней, потому что хотят удовлетворять свои потребительские и материалистичные наклоноости. А деньги, кто не в курсе, бегут туда, где самое яркое шоу (это я после некоторого анализа успеха венчурного капитала и недавнего первого визита в Лас Вегас так размышляю)
Вот взять, к примеру, информационное пространство современных сетей. Оно же практически все управляется ограничениями реляционной алгебры. И даже это часто слишком сложно, поэтому - Гугл. С одним единственным, вообще даже неструктурированным, способом поиска. Реально же это все морально устарело. Это как попытка натянуть презерватив на глобус. Реляционная алгебра имплеметировалась в поиск по базам данных из расчета до нескольких сотен тысяч унифицированных записей. Индексирование текстов - для поиска внутри потока символов с разделителями. Мы же буквально имеем глобус, соединенный переплетением сетей. И ищем пылинки, имея в руках лопату дачную обыкновенную. Ну и иногда еще бульдозер. Революция кажется неизбежной. Но меркантильные интересы сил, движущих интернет, не хотят слышать об инвестициях в то, чего они даже не понимают, а речь идет о реструктуризации уже существующих информационных систем.
Яркий пример - Майкософт и WinFS, объектная фалйовая ситема, кажущийся мммаааленький, ну же шажок в нужном направлении, да еще где - в сердце самой популярной ОС. Увы, исключен из списка фич. Ибо решатели с деньгами так и не поняли, что за этим стоит.
Возьмем какой-нибудь Гугляндекс, и наберем "Вася" (надеюсь, ни у кого не возникает возражений, что это основной способ найти информацию в Сети?). Что мы реально получаем? Список линков на документы (для простоты сайты будут документами): "Вася Пупкин - наш медвед и превед!", "О морфологии имени Василий" и какой-нибудь "Меня теперь любят Петя, Вася и Коля. Я жутко счастлива, что купила бигуди с нейропрограммированием реинкарнации личностных характеристик фирмы Лохматим Лохов Ltd."
Когда эта информация была обновлена? А когда создана? Какой стилистики и содержания я могу ожидать? Есть ли в текстах скрытые цитаты? Откуда они? Кто ссылается на них? Есть ли там иллюстрации? Мультимедиа? - ну это просто.
Есть ли в географической близости от документа А еще документы такого же содержания? Связаны ли они одним корпоративным образованием?
Можно продолжать и продолжать... А ведь вся эта информация где-то есть явно, или приблизительно может быть прикинута. Я уже молчу, что огромное количество нужной информации недоступно из-за чувствительности содержимого и колпака безопасности на нем. Вот тут наступает действительно сложная математика и задачи - как находить и извлекать информацию из интернета, защищенную от несанкционированного доступа, не нарушая этих прав, но допуская доступ там, где он обоснован (сбор статистики, какие-то правовые условия типа врачебной необходимости, и т.д.)
Этого всего нет не потому, что в Гугляндексах безрукие программеры. Отнюдь. Там работают очень грамотные и сильные ребята. Полируя алгоритмы, созданные первыми библиотекарями на заре цивилизации. Это инертность среды... нашей экосистемы. Проблема одной серии со, скажем, невозможностью транспорта на водороде из-за отсутствия инфраструктуры (а точнее, присутствия другой, бензиновой).
С другой стороны, я верю, что дал сейчас несколько штрихов интернета через 5-10 лет.
aquercus
Честно говоря, мне современные поисковики не нравятся. Они, конечно, намного лучше, чем без них, но почему-то вызывают из памяти образы древних орудий наших далёких предков..очень грубые.
А вот скажите..правда ли, что алгоритмы поиска таковы, что "наверху" оказываются наиболее посещаемые в сети места на заданную тему?
exceeder
Нет, не правда. Но там, безусловно, есть корелляция. Сейчас обьясню. Каждый поиск слова в документе возвращает не "есть/нету", а рейтинг. Обычно число между 0 и 1. Документы с самым высоким рейтингом оказываются вверху. Более высокий рейтинг обычно определяется количеством ссылок на документ. К примеру, если в разных местах в инернете будет написано "классненький гуляш у Васи тут", "пробовал сделать этот гуляш - ничо так", "от гуляша сносит крышу" - и все эти фразы будут находится рядом с линком на сайт guliash.info - то скорее всего этот сайт получит высокий рейтинг относительно слова "гуляш".
Именно так создавались интернетные флэш-мобы. Когда тысячи людей пишут у себя на сайтах "придурок" и дают ссылку на Буша, то личный сайт Буша вдруг начинает отзываться на слово "придурок", причем с высоким рейтингом.
А посещаемость - вторична. Если на сайт существует много линков, да к тому же он высоко в рейтингах поисковиков, естественно на него будут ходить много людей.
vryadli
очень интересно. Как-то кк жизнь сложилась, что в вэтой области, поиск и сортировка я ни черта не знаю.
То есть в Вашем рассказе две темы - одна насчет проблемы серезных инноваций. Это очень занятно, по тому что очень схожую проблему я числю в причинах распада СССР.
Второе - что можно и что стоит ( с том смысле, что он реально сумеет использовать) человеку хотеть для обращения инфой. Как изменять само думанье, по мере того, как возмжности обобщения и анализа инфы увеличиваются.
А кстати, может кто-нибудь знает пpиличные книжки уровня примерно "Первых трех секуд" по информатике в самом широком смысле этого слова? Tипа черненького Окуня (крючков побольше)тоже сойдет.