Форум ''Интернет и Право''

Основной раздел => Общие обсуждения => Тема начата: Андрей С.В. от 02 Июня 2008, 18:37:18



Название: Кэширование
Отправлено: Андрей С.В. от 02 Июня 2008, 18:37:18
Коллеги, я вот не совсем понял, подскажите - сохранение кэшей поисковиками интернет-страниц с сайтов явление временное или фактически постоянное? Что-то у меня такое ощущение, что кэш-копии на том же Гугле хранятся постоянно...


Название: Re:Кэширование
Отправлено: Сергей Середа от 03 Июня 2008, 18:37:01
Коллеги, я вот не совсем понял, подскажите - сохранение кэшей поисковиками интернет-страниц с сайтов явление временное или фактически постоянное? Что-то у меня такое ощущение, что кэш-копии на том же Гугле хранятся постоянно...

Андрей, приветствую!

Это не так.

Читаем сперва тут - http://www.google.ru/intl/ru/help/features.html :
===
Сканируя Интернет, Google делает снимок экрана каждой просмотренной страницы и сохраняет его в виде резервной копии на случай, если исходная страница недоступна. За ссылкой "Сохранено в кэше" кроется версия страницы на момент ее последней индексации. Google использует сохраненное в кэше содержание для оценки релевантности страницы относительно запроса поиска.
===
Потом тут - http://www.google.com/support/webmasters/bin/answer.py?answer=34439&ctx=sibling :
===
      
Как часто Google сканирует Интернет?

"Пауки" Google регулярно сканируют Интернет в целях обновления индекса. При этом учитывается множество факторов, в том числе PageRank, ссылки на страницу и ограничения сканирования, например количество параметров URL. На периодичность сканирования конкретных сайтов могут повлиять любые факторы.

Сканирование ведется согласно алгоритму; компьютерные программы определяют, какие сайты сканировать, как часто и сколько страниц брать с каждого из них. Мы не принимаем плату в обмен на более частое сканирование того или иного сайта. Советы о том, как сделать веб-сайт более удобным для сканирования, содержатся в руководстве для веб-мастеров.
===

В переводе это означает, что кэш обновляется с частотой, равной частоте сканирования Интренета, а эта частота зависит от множества параметров, в том числе от рейтинга посещаемости сайта. Соответственно (это уже мой вывод), чем менее посещаем сайт, тем дольше он хранится в кэше, т.к. он реже сканируется.

Думаю, так.


Название: Re:Кэширование
Отправлено: Андрей С.В. от 03 Июня 2008, 20:11:02

В переводе это означает, что кэш обновляется с частотой, равной частоте сканирования Интренета, а эта частота зависит от множества параметров, в том числе от рейтинга посещаемости сайта. Соответственно (это уже мой вывод), чем менее посещаем сайт, тем дольше он хранится в кэше, т.к. он реже сканируется.

Спасибо, Сергей, за разъяснения. Возможно это и очевидные вещи, однако уж больно подозрительно выглядят кэш-копии страниц, хранящиеся действительно долго, видимо, на серверах поисковиков, а может и на промежуточных прокси-серверах где-нить. К тому же, неизвестно действительно "обновляет ли" Google страницы или делает новые кэш-копии... Между прочим, однозначной судебной практики о законности кэш-копий поисковиков нет  ;)...


Название: Re:Кэширование
Отправлено: Антон Серго от 03 Июня 2008, 20:28:15
Между прочим, однозначной судебной практики о законности кэш-копий поисковиков нет  ;)...
А разве есть практика, что они законны?


Название: Re:Кэширование
Отправлено: Андрей С.В. от 03 Июня 2008, 20:39:07
А разве есть практика, что они законны?

Да, Антон, но не в РФ ... Например, в США дело Field  v. Google и довольно свежее (2006 г.), если интересно решение могу скинуть в личку ;)


Название: Re:Кэширование
Отправлено: Антон Серго от 03 Июня 2008, 20:47:22
Да, Антон, но не в РФ ... Например, в США дело Field  v. Google и довольно свежее (2006 г.), если интересно решение могу скинуть в личку ;)
Любыпытно, не знал это дело.
А что суд решил, что это допустимые технологические копии? :-)


Название: Re:Кэширование
Отправлено: Андрей С.В. от 03 Июня 2008, 21:00:01
Любыпытно, не знал это дело.
А что суд решил, что это допустимые технологические копии? :-)

Не совсем, суд посчитал, что использование произведений в результатах поиска Google не выходит за рамки концепции добросовестного использования. Более того, суд отвел Google исключительно пассивную роль в возникших правоотношениях.... Справедливости ради надо заметить, что и истец (адвокат-автор в одном лице) был тоже не "овечка" в этом деле ;)


Название: Re:Кэширование
Отправлено: Igor Michailov от 05 Июня 2008, 04:54:49
Кроме поисковиков есть примечательный ресурс со скромным названием:  "Архив Интернета" - archive.org .

Где, например, по запросу http://web.archive.org/web/*/http://www.internet-law.ru
можно посмотреть как выглядели основные страницы сайта "Интернет и Право" аж с 2001 года.  ;)

Цитировать
Добро пожаловать на частый ресурс всемирной паутины. Не претендуя на звание "Мегапортал" или "Гигапортал", можно предположить, что Человек, интересующийся юридическими аспектами компьютерной индустрии найдет здесь интересующую его информацию.

Кстати, на главной странице копии сайта "Интернет и Право" за ноябрь 2001 года можно найти еще один адрес электронной почты Антона, который сейчас, я так понимаю, не офишируется.   8)


Название: Re:Кэширование
Отправлено: Андрей С.В. от 05 Июня 2008, 08:23:03
Кстати, на главной странице копии сайта "Интернет и Право" за ноябрь 2001 года можно найти еще один адрес электронной почты Антона, который сейчас, я так понимаю, не офишируется.   8)

 ;D Игорь, называется, накопал ;)  Ну вот и пример того, что кэш-копии страниц могут не подпадать под действия пп.1 п.2 ст.1270 ГК РФ, поскольку представляется временное хранение - это, по-моему скромному мнению, временное в разумных пределах, а не 7, 10, 20 лет...

Коллеги, а кто-нить слышал о том, что поисковики хранят кэш-копии довольно продолжительное время?


Название: Re:Кэширование
Отправлено: Dimon от 05 Июня 2008, 11:49:59
Думаю, что кэш-копии вполне могут храниться. Это нужно у поисковиков выяснять. Причем тут есть такие нюансы: страница обновляемая, страница давно не обновляемая, страница удаленная. Так вот если страница обновляемая, то может храниться текущая копия (если где-то еще дополнительно не хранится более старая версия этой же страницы), страница давно не обновляемая - тут все понятно. Куда интереснее вопрос с удаленными страницами. хранятся ли копии удаленых страниц и как долго (так как мы видим, что их заменить нечем, так как они необновляемые, с одной стороны, а с другой - из сети на сайте они уже недоступны). Понятно, что хранение копий удаленных страниц облегчает доказывание в случае, если при предъявлении претензии, они были стерты правонарушителем (а правообладатель не позаботился о фиксации док заблаговременно).

Другая сторона вопроса: "преференции" поисковикам, если исходить из того, что они избегают ответственности (может и не всегда) со стороны правообладателей. Любой веб-проект может резонно задаться вопросом, почему поисковик может свободно кешировать чужие данные и избегать ответственности, а наш веб-проект - привлекается. У нас типа тоже "поисковик". В общем, я бы мог написать на эту тему целое сочинение, но очень длинное оно получится.


Название: Re:Кэширование
Отправлено: interlawyer от 31 Июля 2008, 15:52:23
1) Яндекс хранит кэш копии на самом деле долго-пока что я лично знаю копию одного сайта-информации с него-давностью 2-3 года.
Сайт-очень хорошо посещается.

2) Вопрос-следовательно-в РФ-кэшированные поисковиком страницы-не могут служить законным доказательством?


Название: Re:Кэширование
Отправлено: Николай Николаевич Федотов от 01 Августа 2008, 00:22:19
1) Яндекс хранит кэш копии на самом деле долго-пока что я лично знаю копию одного сайта-информации с него-давностью 2-3 года.
Сайт-очень хорошо посещается.
По моим сведениям, поисковики (настоящие поисковики) хранят кэш-копию до следующей переиндексации. Чтобы уничтожить эту копию, владелец сайта должен изменить сайт и заказать внеочередную переиндексацию.

Пожалуйста, укажите кэш-копию двухлетней давности.


Название: Re:Кэширование
Отправлено: Андрей С.В. от 15 Сентября 2008, 10:56:54
По моим сведениям, поисковики (настоящие поисковики) хранят кэш-копию до следующей переиндексации. Чтобы уничтожить эту копию, владелец сайта должен изменить сайт и заказать внеочередную переиндексацию.

Пожалуйста, укажите кэш-копию двухлетней давности.

Ну насчет кэш-копий 2-3 летней давности я не знаю, но на Google видел кэш-копии датированные началом мая 2008, что составляет почти 6 месяцев - солидный срок....

Николай Николаевич, так если сайт не изменяется владельцем и не переиндексируется, то кэш-копии могут хранится(по крайней мере теоретически) и год?