Перейти к содержанию

Количество "страничек" Вконтакте


Константин Артурыч

Рекомендуемые сообщения

От нечего делать зашел на этот сайт, хоть там и не зарегистрирован. Тыкаю "О сайте", читаю, светится красивая цифра - свыше 100 миллионов пользователей.

Тыкаю. Попадаю в "Каталог пользователей", смотрю - 143 000 000 - последняя цифра.тыкаю, пытаюсь добраться до последнего пользователя. Открывается страничка... А там половина DELETED ))))

Задело меня это, решил узнать у известного форумчанина, как мол через каталог это дело посчитать, исключив удаленных. Не успел спросить как тот уже сваял скрипт "скачивалку" и "считалку" страничек.

Чуть позже я отвлекся, решил глянуть других пользователей, глянь... а максимальное число уже - 102 миллиона... потом было 120, потом 130, потом 101... Понял что каталог - зло. И сделан чуть ли не для отвода глаз.

Решил копнуть чуть дальше - оказывается пользователь с ID id139056788 ( сейчас выдал как самый последний ) существует, а пользователь с id100000000 "типа удалил" свою страницу, но удаленная страница выглядит так id141318112 , соответсно стамиллионную страничку не создавали.

И таких вот пробелов не мало. Так же нет "красивой" id99999999.

Не все "красивые" странички так, но таких не мало, т.е получается по каталогу не "посчитать" да и врет он.

Есть у кого интерес посчитать энто дело ?

В программировании не силен, но я так прикинул, требуется "просмотреть" около 200 ( ИМХО больше - лучше ) миллионов страничек на наличие - не создана ( найти соответствие - красивый ид - не создана), количество созданных страничек, ( самая последняя на момент подсчета), и количество удаленных (DELETED) страниц.

Кому интересна сия математика? :)

Ссылка на комментарий
Поделиться на другие сайты

  • Ответов 65
  • Создана
  • Последний ответ

Топ авторов темы

  • Skarbovoy

    20

  • Pomka.

    16

  • Константин Артурыч

    9

  • kos1nus

    7

Почти каждый пользователь Вконтакта (точно так, как и всех остальных соц.сетей - Одноклассников, Майл_ру) для перестраховки завёл себе "левую" страничку с фейковыми данными. Плюс там бесчисленное зарегистрированное количество спам и порноботов. Поэтому реальное количество пользователей (а не страничек!) - это то, что заявляют хозяева ресурса поделённое на 3, т.е. 150 000 000 : 3 = 49 999 999 :)

Ссылка на комментарий
Поделиться на другие сайты

Почти каждый пользователь Вконтакта (точно так, как и всех остальных соц.сетей - Одноклассников, Майл_ру) для перестраховки завёл себе "левую" страничку с фейковыми данными. Плюс там бесчисленное зарегистрированное количество спам и порноботов. Поэтому реальное количество пользователей (а не страничек!) - это то, что заявляют хозяева ресурса поделённое на 3, т.е. 150 000 000 : 3 = 49 999 999 :)

Так непонятно зачем пропускать ID при регистрации. Да и ИМХО если потом собрать все данные в таблицы того же эхеля, то можно отбросить и часть ботов, так что можно будет вполне приближенные цифры получить :appl:

Ссылка на комментарий
Поделиться на другие сайты

Есть у кого интерес посчитать энто дело ?

нет смысла. раньше счётчик, который висел на главной, выводился функцией randomize.

потом их видимо пропалили в каких-нибудь сми или организациях и счётчик убрали.

Ссылка на комментарий
Поделиться на другие сайты

Простой запрос по ID - есть инфа или нет - при таком количестве будет проходить несколько долговато

Речь идет о днях или месяцах? )))

Ссылка на комментарий
Поделиться на другие сайты

Речь идет о днях или месяцах? )))

не важно сколько это будет длится

главное результат но смысл результата мне не понятен.

Ссылка на комментарий
Поделиться на другие сайты

12 часов работы -3% страниц проверено - так что время примерно 2недели
если этот скрипт запусти сразу несколько человек, работа пойдет быстрее. ну скажем 10 человек возьмет ид с интервалом в 15 000 000. тогда за два-три дня мы выведем контакт на чистую воду)))
Ссылка на комментарий
Поделиться на другие сайты

если этот скрипт запусти сразу несколько человек, работа пойдет быстрее. ну скажем 10 человек возьмет ид с интервалом в 15 000 000. тогда за два-три дня мы выведем контакт на чистую воду)))

Не получится с ним.

Он по каталогу работает, а каталог - фигня какая то.:)

Надо более серьезную вещь писать.

Ссылка на комментарий
Поделиться на другие сайты

Не получится с ним.

Он по каталогу работает, а каталог - фигня какая то.:)

Надо более серьезную вещь писать.

почему по каталогу? Я себе представлял последовательный перебор каждой страницы по id. тут два варианта либо она есть либо ее нет. если она есть еще можно проверить на имя - либо оно равно "DELETED" либо нет.
Ссылка на комментарий
Поделиться на другие сайты

почему по каталогу? Я себе представлял последовательный перебор каждой страницы по id. тут два варианта либо она есть либо ее нет. если она есть еще можно проверить на имя - либо оно равно "DELETED" либо нет.

Не, такого скрипта пока нет )

Напишешь? )))

Я тебе примерную структуру скину чокаво если возьмешься )

Там не 2 а 3 варианта :)

Изменено пользователем Константин Артурыч
Ссылка на комментарий
Поделиться на другие сайты

Константин Артурыч

Можешь сказать результат для первой сотни?

Раскрывающийся текст:

25:75 - оно?

 

Изменено пользователем Skarbovoy
Ссылка на комментарий
Поделиться на другие сайты

Пожалуйста, войдите, чтобы комментировать

Вы сможете оставить комментарий после входа в



Войти

×
×
  • Создать...