Имя: Пароль:
IT
Веб-мастеринг
Инструменты для автоматизированного анализа сайтов
0 vqwy
 
15.11.15
20:28
Собственно, для одного исследования нужен инструмент для анализа сайтов.
Конкретно, интересует схема: выбрать все сайты, в тайтлах у которых есть определенные ключевые слова (слова я могу задать) и затем сгруппировать их по количеству страниц, по самым повторяемым словам и т.д.
Есть ли что-то подобное готовое?
1 Maniac
 
15.11.15
20:29
Сейчас мало сайтов которые не блокируют за такие попытки.
2 vqwy
 
15.11.15
20:32
Жень, ну пусть блокируют, мне в принципе узнать надо
3 Остап Сулейманович
 
15.11.15
20:35
Мне вот интересно как можно заблокировать чтение заголовка? Это такие секретные сайты, которые свои заголовки прячут, а при попытке их прочитать блокируют к себе доступ?.
ИМХО - Маня опять в своем стиле.
4 vqwy
 
15.11.15
20:36
(3) А вдруг за выходные теперь так стало? о_О
5 Maniac
 
15.11.15
20:38
Смотря что он хочет прочитать.
Если у сайта будет 100 000 страниц, то прочитать его будет нереально;

Сейчас практически у всех сайтов есть такая фишка как блокировка по хитам.
Типа если кто то пытается сделать больше 50 хитов за одну минуту - блокировка.
6 Остап Сулейманович
 
15.11.15
20:40
(0) Выловить из тэга title содержимое известного сайта - не вопрос.
Вопрос всех вопросов - "выбрать все сайты". Вот просто интересно где можно заполучить список вот этого "все сайты"?
Наклонить сделать такую выборку какую-либо поисковую машину типа яндекса или гугля?
Так поисковые машины сначала индексируют по keywords и только потом по title.
ИМХО - самый надежный способ - хакнуть базу гуголя ))).
7 Wirtuozzz
 
15.11.15
20:41
(5) Это на сео не влияет?
8 Maniac
 
15.11.15
20:41
(3) а как ты думал - что тебе просто так дадут доступ прочитать весь сайт?)
Почти каждая контора (если речь идет о каком то сайте торговой фирмы) заботится о том чтобы сайт не могли парсить конкуренты и прочие. за исключением поисковых ботов.
9 Остап Сулейманович
 
15.11.15
20:41
(5) А зачем сайт читать 50 раз / мин. Типа за один раз с title не совладаешь?
10 Остап Сулейманович
 
15.11.15
20:48
ТС строит убивцу Гуголя?
11 Wirtuozzz
 
15.11.15
20:49
(10) ТС строит мугль. Это типа Гугля, только наш, отечественный.
12 vqwy
 
15.11.15
20:50
(10) не, просто надо обзор рынка составить на большом объеме, а перебирать поссылочно лень
13 vqwy
 
15.11.15
20:51
типа вот этого, что ли http://netpeak.ru/software/netpeak-spider/?source=netpeak.ua
14 Maniac
 
15.11.15
20:52
У меня было вагон и маленькая тележка клиентов, которые хотели чтоб в 1С ним с любых сайтов можно было заливать товары, цены - все что угодно.

Увы но тут только губозакаточную машинку можно предложить.
15 vqwy
 
15.11.15
20:53
(14) Маня, ну не об этом же, что везде свою машинку суёшь
16 Garykom
 
гуру
15.11.15
20:59
(14) точнее у них $ только на машинку хватало
а ведь можно было их всех собрать и на общак наваять подобную систему ))
особенно если эти клиенты пересекаются одни хотят данные с других которые хотят с 1-х ))
17 NikVars
 
17.11.15
10:10