Константин Артурыч Опубликовано 2 августа, 2011 Поделиться Опубликовано 2 августа, 2011 От нечего делать зашел на этот сайт, хоть там и не зарегистрирован. Тыкаю "О сайте", читаю, светится красивая цифра - свыше 100 миллионов пользователей. Тыкаю. Попадаю в "Каталог пользователей", смотрю - 143 000 000 - последняя цифра.тыкаю, пытаюсь добраться до последнего пользователя. Открывается страничка... А там половина DELETED )))) Задело меня это, решил узнать у известного форумчанина, как мол через каталог это дело посчитать, исключив удаленных. Не успел спросить как тот уже сваял скрипт "скачивалку" и "считалку" страничек. Чуть позже я отвлекся, решил глянуть других пользователей, глянь... а максимальное число уже - 102 миллиона... потом было 120, потом 130, потом 101... Понял что каталог - зло. И сделан чуть ли не для отвода глаз. Решил копнуть чуть дальше - оказывается пользователь с ID id139056788 ( сейчас выдал как самый последний ) существует, а пользователь с id100000000 "типа удалил" свою страницу, но удаленная страница выглядит так id141318112 , соответсно стамиллионную страничку не создавали. И таких вот пробелов не мало. Так же нет "красивой" id99999999. Не все "красивые" странички так, но таких не мало, т.е получается по каталогу не "посчитать" да и врет он. Есть у кого интерес посчитать энто дело ? В программировании не силен, но я так прикинул, требуется "просмотреть" около 200 ( ИМХО больше - лучше ) миллионов страничек на наличие - не создана ( найти соответствие - красивый ид - не создана), количество созданных страничек, ( самая последняя на момент подсчета), и количество удаленных (DELETED) страниц. Кому интересна сия математика? Ссылка на комментарий Поделиться на другие сайты Поделиться
Sandynist Опубликовано 2 августа, 2011 Поделиться Опубликовано 2 августа, 2011 Почти каждый пользователь Вконтакта (точно так, как и всех остальных соц.сетей - Одноклассников, Майл_ру) для перестраховки завёл себе "левую" страничку с фейковыми данными. Плюс там бесчисленное зарегистрированное количество спам и порноботов. Поэтому реальное количество пользователей (а не страничек!) - это то, что заявляют хозяева ресурса поделённое на 3, т.е. 150 000 000 : 3 = 49 999 999 Ссылка на комментарий Поделиться на другие сайты Поделиться
Константин Артурыч Опубликовано 2 августа, 2011 Автор Поделиться Опубликовано 2 августа, 2011 Почти каждый пользователь Вконтакта (точно так, как и всех остальных соц.сетей - Одноклассников, Майл_ру) для перестраховки завёл себе "левую" страничку с фейковыми данными. Плюс там бесчисленное зарегистрированное количество спам и порноботов. Поэтому реальное количество пользователей (а не страничек!) - это то, что заявляют хозяева ресурса поделённое на 3, т.е. 150 000 000 : 3 = 49 999 999 Так непонятно зачем пропускать ID при регистрации. Да и ИМХО если потом собрать все данные в таблицы того же эхеля, то можно отбросить и часть ботов, так что можно будет вполне приближенные цифры получить Ссылка на комментарий Поделиться на другие сайты Поделиться
Elly Опубликовано 2 августа, 2011 Поделиться Опубликовано 2 августа, 2011 Есть у кого интерес посчитать энто дело ? нет смысла. раньше счётчик, который висел на главной, выводился функцией randomize. потом их видимо пропалили в каких-нибудь сми или организациях и счётчик убрали. Ссылка на комментарий Поделиться на другие сайты Поделиться
Kapral Опубликовано 2 августа, 2011 Поделиться Опубликовано 2 августа, 2011 Простой запрос по ID - есть инфа или нет - при таком количестве будет проходить несколько долговато Ссылка на комментарий Поделиться на другие сайты Поделиться
Константин Артурыч Опубликовано 2 августа, 2011 Автор Поделиться Опубликовано 2 августа, 2011 Простой запрос по ID - есть инфа или нет - при таком количестве будет проходить несколько долговато Речь идет о днях или месяцах? ))) Ссылка на комментарий Поделиться на другие сайты Поделиться
Pomka. Опубликовано 2 августа, 2011 Поделиться Опубликовано 2 августа, 2011 Речь идет о днях или месяцах? ))) не важно сколько это будет длится главное результат но смысл результата мне не понятен. Ссылка на комментарий Поделиться на другие сайты Поделиться
Kapral Опубликовано 2 августа, 2011 Поделиться Опубликовано 2 августа, 2011 Речь идет о днях или месяцах? ))) Завтра скажу я тот скрипт запустил на ночь Ссылка на комментарий Поделиться на другие сайты Поделиться
Kapral Опубликовано 3 августа, 2011 Поделиться Опубликовано 3 августа, 2011 12 часов работы -3% страниц проверено - так что время примерно 2недели Ссылка на комментарий Поделиться на другие сайты Поделиться
kos1nus Опубликовано 4 августа, 2011 Поделиться Опубликовано 4 августа, 2011 12 часов работы -3% страниц проверено - так что время примерно 2неделиесли этот скрипт запусти сразу несколько человек, работа пойдет быстрее. ну скажем 10 человек возьмет ид с интервалом в 15 000 000. тогда за два-три дня мы выведем контакт на чистую воду))) Ссылка на комментарий Поделиться на другие сайты Поделиться
Константин Артурыч Опубликовано 4 августа, 2011 Автор Поделиться Опубликовано 4 августа, 2011 если этот скрипт запусти сразу несколько человек, работа пойдет быстрее. ну скажем 10 человек возьмет ид с интервалом в 15 000 000. тогда за два-три дня мы выведем контакт на чистую воду))) Не получится с ним. Он по каталогу работает, а каталог - фигня какая то. Надо более серьезную вещь писать. Ссылка на комментарий Поделиться на другие сайты Поделиться
kos1nus Опубликовано 4 августа, 2011 Поделиться Опубликовано 4 августа, 2011 Не получится с ним.Он по каталогу работает, а каталог - фигня какая то. Надо более серьезную вещь писать. почему по каталогу? Я себе представлял последовательный перебор каждой страницы по id. тут два варианта либо она есть либо ее нет. если она есть еще можно проверить на имя - либо оно равно "DELETED" либо нет. Ссылка на комментарий Поделиться на другие сайты Поделиться
Константин Артурыч Опубликовано 4 августа, 2011 Автор Поделиться Опубликовано 4 августа, 2011 (изменено) почему по каталогу? Я себе представлял последовательный перебор каждой страницы по id. тут два варианта либо она есть либо ее нет. если она есть еще можно проверить на имя - либо оно равно "DELETED" либо нет. Не, такого скрипта пока нет ) Напишешь? ))) Я тебе примерную структуру скину чокаво если возьмешься ) Там не 2 а 3 варианта Изменено 4 августа, 2011 пользователем Константин Артурыч Ссылка на комментарий Поделиться на другие сайты Поделиться
Pomka. Опубликовано 4 августа, 2011 Поделиться Опубликовано 4 августа, 2011 мы выведем контакт на чистую воду))) за вами уже выехала бригада чистильщиков из соц.сети Вконтакте. Ссылка на комментарий Поделиться на другие сайты Поделиться
Skarbovoy Опубликовано 4 августа, 2011 Поделиться Опубликовано 4 августа, 2011 (изменено) Константин Артурыч Можешь сказать результат для первой сотни? Раскрывающийся текст: 25:75 - оно? Изменено 4 августа, 2011 пользователем Skarbovoy Ссылка на комментарий Поделиться на другие сайты Поделиться
Рекомендуемые сообщения
Пожалуйста, войдите, чтобы комментировать
Вы сможете оставить комментарий после входа в
Войти