Форум ''Интернет и Право''

Основной раздел => Авторское право, программное обеспечение => Тема начата: Timon от 18 Ноября 2005, 16:04:27



Название: Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Timon от 18 Ноября 2005, 16:04:27
Если я правильно понимаю, то проблема поиска нарушений авторского права в сети Интернет существует... Эта проблема касается и обычных авторов... и организаций правообладателей ... практически всех кто хоть раз что-то опубликовал в глобальной сети!

Интересно мнение профессионалов и людей имеющих дело с такими нарушениями, по поводу систем автоматизированного поиска нарушений авторского права в сети Интернет...

Какими системами пользуются?..
Какие функции считают наиболее важными?..
Что должны уметь делать такие системы?


С Уважением, аспирант Московского Государственного Университета Печати


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: yuriyah от 18 Ноября 2005, 16:20:58
Дмитрий, обычно это делается так.
В поисковик забивается фраза из собственого произвдеения, которая, по мнению автора, в других произведениях встречается довольно редко. Если находится тот же текст в другом месте, вот оно, нарушение.
А вообще, прежде чем автоматизировать поиск нарушений авторского права, неплохо бы понять, что такое авторское право, что такое его нарушение, и только потом, как искать нарушения.


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Timon от 18 Ноября 2005, 16:51:14
Дмитрий, обычно это делается так.
В поисковик забивается фраза из собственого произвдеения, которая, по мнению автора, в других произведениях встречается довольно редко. Если находится тот же текст в другом месте, вот оно, нарушение.
Такой способ подходит если Вы человек (а не организация) и если у Вас мало опубликованных работ...

Представьте себе сколько человеко-часов надо потратить правообладающей огранизации для поиска нарушений авторского права...  Сразу возникает необходимость автоматизировать этот процесс.

А вообще, прежде чем автоматизировать поиск нарушений авторского права, неплохо бы понять, что такое авторское право, что такое его нарушение, и только потом, как искать нарушения.

Согласен! Но в законе (я его читал дважды) я не увидел чёткой формулировки для НАРУШЕНИЯ АВТОРСКОГО ПРАВА. (возможно не там смотрел... или плохо смотрел)...
Применительно к моей проблеме (Текстовая информация) я понимаю проблему так: Нарушителем является любой, кто без ведома автора (считаем что я никому права не передавал) воспроизводит фрагмент текста (не соблюдая правила цитирования). Но чаще всего происходит не просто воспроизведение, а присваивание авторства (нарушение исключительного авторского права).

А искать, собственно говоря, надо сначала тексты, авторы которых нарушили авторское право, а уже потом самих авторов...



Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Dmitry от 18 Ноября 2005, 17:04:07
Если с ангийским нормально - взгляните здесь http://www.textmark.com/ (http://www.textmark.com/)


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Timon от 18 Ноября 2005, 17:20:34
Если с ангийским нормально - взгляните здесь http://www.textmark.com/ (http://www.textmark.com/)

Спасибо за ссылку. На западе такими проблемами занимаются давно... и систем по поиску плагиата очень много (некоторые объединяют десятки университетов в разных странах).

Мне бы хотелось узнать мнение российских юристов и пользователей...
Какие функции необходимы Вам... Нерешаемых задач нет... Есть сложные проблемы решаемые по этапам...

Программно такие задачи решать можно... и нужно...
Математический аппарат есть: Экспертные системы, Системы Искусственного интеллекта, Нечёткая логика, Размытые множества, Теория множеств... ... ...


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: yuriyah от 18 Ноября 2005, 18:12:18
Дмитрий прав. Проще защитить свои произведения первоначально, чем изобретать велосипед. А чтобы понять, что такое нарушение авторского права, нужно изучить теорию права, где написано, что такое "право", и что такое "нарушение права".
Понимаете ли в чем дело, Дмитрий. Вы пытаетесь решить проблему математическим методом в области, которая не является математикой. У правовых наук есть свои методы и принципы, которые позволяют определить нарушение, правомерное действие или злоупотребление. Но эти методы не математические, а, следовательно, не могут быть формализованы в алгоритм. Во всяком случае, пока не появится натуральный ИИ, а не то, что им называют на данный момент.


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Антон Серго от 19 Ноября 2005, 01:50:20
Есть какой-то сервис (не могу найти URL) на базе Гугла. Суть в том, что даешь URL своей страницы с текстом, а Гугл ищет страницы с таким же текстом по своей базе.

P.S. Из личного опыта: в 2003 году (шутки ради) я на странцах сайта написал невидимый текст: "(скопировано с internet-law.ru)" - это мне очень помогло.  ;D
Уже прошло столько лет, но yandex до сих пор откликается на запрос: http://www.yandex.ru/yandsearch?rpt=rad&text=%F1%EA%EE%EF%E8%F0%EE%E2%E0%ED%EE+%F1+internet-law.ru (http://www.yandex.ru/yandsearch?rpt=rad&text=%F1%EA%EE%EF%E8%F0%EE%E2%E0%ED%EE+%F1+internet-law.ru)


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Timon от 19 Ноября 2005, 12:21:38
Есть какой-то сервис (не могу найти URL) на базе Гугла. Суть в том, что даешь URL своей страницы с текстом, а Гугл ищет страницы с таким же текстом по своей базе.
Скорее всего Вы имеете в виду http://www.copyscape.com/
Проблема только в одном: Если у Вас есть текст, то Вы его обязательно должны выложить в Интернет и ещё подождать когда Google проиндексирует страницу.

Из личного опыта: в 2003 году (шутки ради) я на странцах сайта написал невидимый текст: "(скопировано с internet-law.ru)" - это мне очень помогло.  ;D
Уже прошло столько лет, но yandex до сих пор откликается на запрос: http://www.yandex.ru/yandsearch?rpt=rad&text=%F1%EA%EE%EF%E8%F0%EE%E2%E0%ED%EE+%F1+internet-law.ru (http://www.yandex.ru/yandsearch?rpt=rad&text=%F1%EA%EE%EF%E8%F0%EE%E2%E0%ED%EE+%F1+internet-law.ru)
Не всегда невидимый текст является хорошим способом защиты. Я не знаю по какой технологии это делали Вы, но в общем случае за невидимый текст некоторые поисковики могут снизить ИНДЕКС сайта! Программно такие невидимые тексты легко обнаруживаются... а поисковик может посчитать, что Вы недобросовестно накручиваете индекс...


P.S. Дело в том, что меня больше интересует не защита (хотя это тоже интересно), а поиск текстов, нарушающих чьи-то права...


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Dimon от 19 Ноября 2005, 13:17:20
Профессор одного из американских вузов в свое время разрабатывал софтину для поиска плагиата. У меня она даже где-то валялась на винте.

Тема очень актуальна касательно списывания дипломов, контрольных работ, рефератов и пр. в вузах. В Штатах, как я читал, за плагиат могут и отчислить, а преподам (некоторые из которых тоже плагиаторы) дают плохие рекомендации. Причем проходили новости, что некоторых студентов могут лишить дипломов уже постфактум, то есть уже после выпуска, если обнаружат факт плагиата. Только как далеко это там зашло, точно трудно сказать.


Вообще,  некто yuriyah по-моему и занимался разработкой антиплагиатного регламента в нашем вузе. Поэтому странно от него читать здесь некоторые вещи.


Не раз слышал и о других сервисах. Думаю, что через поисковики инфу об этом можно найти, так как время от времени тема муссируется на различных форумах правоведов, сайтосоздателей, веб-мастеров, и пр.


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Антон Серго от 19 Ноября 2005, 15:30:58
P.S. Дело в том, что меня больше интересует не защита (хотя это тоже интересно), а поиск текстов, нарушающих чьи-то права...
Я представляю ее работу так: программа (назовем ее "Cyberspy") работает по сценарию:
1. Прога получает на обработку текст1 (лучше в html). Обработывает его и хранит в своей бд.
2. Прога запускает на интернет и как поисковик бродит по инету и проводит примитивное сопоставленние текста1 с анализируемой в данный момент страницей.

Пожелания (мечты):
1. Работа (анализ) html, doc, rtf, pdf.
2. Обработка для анализа не одной страницу, а целого раздела или всего сайта, домена, поддомена.
3. Оптимизированная обработка страниц (а не тупое сопоставление каждой интернет-страницы с каждой страницы из базы данных).

P.S.
1. Готов быть бета-тестером.
2. Готов купить работающий продукт (а может и права на него).
3. Готов оказать всяческое содействие в регистрации продукта в Роспатенте.
Поскольку, этатема была уже мне близка много лет назад и подходил я к ней с другой стороны... См. "копирайтер" на первой странице сайта.


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Timon от 19 Ноября 2005, 23:51:00
Я представляю ее работу так: программа (назовем ее "Cyberspy") работает по сценарию:
1. Прога получает на обработку текст1 (лучше в html). Обработывает его и хранит в своей бд.
2. Прога запускает на интернет и как поисковик бродит по инету и проводит примитивное сопоставленние текста1 с анализируемой в данный момент страницей.

Пожелания (мечты):
1. Работа (анализ) html, doc, rtf, pdf.
2. Обработка для анализа не одной страницу, а целого раздела или всего сайта, домена, поддомена.
3. Оптимизированная обработка страниц (а не тупое сопоставление каждой интернет-страницы с каждой страницы из базы данных).

P.S.
1. Готов быть бета-тестером.
2. Готов купить работающий продукт (а может и права на него).
3. Готов оказать всяческое содействие в регистрации продукта в Роспатенте.
Поскольку, этатема была уже мне близка много лет назад и подходил я к ней с другой стороны... См. "копирайтер" на первой странице сайта.

Огромное спасибо на конкретные ответы и предложения!
Вопрос передачи прав на потенциальный программный продукт вполне реально будет обсудить... Но сейчас его пока нет.
Плюс ко всему задача первого плана - написание и защита диссертации. А для защиты диссертации необходимо на практике доказать правильность предложенного мною математического аппарата. Как Вы понимаете от программной реализации некоторых алгоритмов и методов до КОММЕРЧЕСКОГО ПРОГРАММНОГО ПРОДУКТА довольно далеко... Но всё возможно... В любом случае, я теперь знаю что, то, чем я сейчас занимаюсь актуально и если что, то будет востребовано.

Спасибо за поддержку.


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Timon от 20 Ноября 2005, 00:20:50
Тема очень актуальна касательно списывания дипломов, контрольных работ, рефератов и пр. в вузах. В Штатах, как я читал, за плагиат могут и отчислить, а преподам (некоторые из которых тоже плагиаторы) дают плохие рекомендации. Причем проходили новости, что некоторых студентов могут лишить дипломов уже постфактум, то есть уже после выпуска, если обнаружат факт плагиата. Только как далеко это там зашло, точно трудно сказать.

Вы абсолютно правы. В других странах (США, Канада, UK, ...) этой проблемой занимаются давно... сервисов (их) много... они реально работают. А вот у нас многие только начинают задумываться о том что авторское право существует. Люди нарушают закон об авторском праве, так как просто не знают о нём... (но не знание закона не освобождает от его... ...)

Реальный пример из жизни: Девушка с высшим образованием делает коммерческие электронные издания. При этом она берёт некоторые материалы из Интернета. На мой вопрос про нарушение прав авторов я услышал что-то вроде того, что "Ну ведь они выложены в сети, следовательно, свободны для копирования".

В этом случае человек просто не знал (не хотел знать) о том что нарушает права автора.

Есть другая крайность: С ней столкнулись на западе. Преподаватели университетов отсылают работы студентов в системы по проверке на плагиат. Таким образом эти работы оседают в базах данных систем по проверке плагиата. И ЭТО НАРУШАЕТ ПРАВА СТУДЕНТОВ. Ведь у них никто не спрашивал разрешения на это. (а ведь при этом создаётся реальная копия студенческой работы!!!) И обязать студентов разрешать отсылку работ никто не сможет. свобода выбора...свобода заключения договора... и т.п.

А в этом случае... начинается горе от ума... Хотели как лучше (чтобы не нарушались права, а получается что нарушаются права других).


Просто на западе уже прошли длинный путь... а мы (Россия) только пытаемся найти дорогу, по которой будем идти...  вроде идём к ВТО... но по авторским правам там большие проблемы у нашей страны.


Не раз слышал и о других сервисах. Думаю, что через поисковики инфу об этом можно найти, так как время от времени тема муссируется на различных форумах правоведов, сайтосоздателей, веб-мастеров, и пр.

Сервисы есть! правда русских почти нет...
Но в любом случае, чтобы написать нормальную программу надо вникнуть в тему... (я этим сейчас и занимаюсь) :-)


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: yuriyah от 21 Ноября 2005, 14:36:39
Dimon, что конкретно Вам показалось странно? Тут некто yuriyah интересуется.
Что касается автоматизации для Интернета, я же не препятствую обсуждению, просто считаю такую перспективу малореальной.


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Dimon от 21 Ноября 2005, 23:46:25
Timon
Все правильно, есть люди, которые не знают законов.

А есть еще категория лиц, которая исходит из того, что их вообще сюблюдать не нужно вне зависимости от того, знаешь их или нет.

В нашей стране я сталкивался с ситуацией когда даже не студент, а вузовские профессора авторские права нарушают. Но это долгий и отдельный рассказ.

Мне кажется, что на Западе возможность отсылки работы студента для проверки на плагиат может/должно быть предусмотрено в договоре со студентом, который учится в данном вузе. Иначе его могут туда не взять да и все.

Тестирование указанной программы американского профессора, разрекламированной благодаря СМИ на весь интернет, лично меня не впечатлило.


yuriyah, да я просто подумал, что прочту море инфы от Вас в этом топике. Ожидания превзошли реальность.


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: yuriyah от 22 Ноября 2005, 12:36:37
Дима, гм, может быть, Вы говорите о том, о чем я не помню, но вообще-то я участвовал в разработке т.н. "Положения о плагиате", которое было использовано для итогового документа. Вот и все. Про автоматизацию там речи не было.


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Dimon от 26 Ноября 2005, 06:58:06
Дима, гм, может быть, Вы говорите о том, о чем я не помню, но вообще-то я участвовал в разработке т.н. "Положения о плагиате", которое было использовано для итогового документа. Вот и все. Про автоматизацию там речи не было.


Ну, это-то я и запомнил :) И подумал, что раз занимались разработкой Положения, то может приходилось знакомиться и с "автоматиизированными" способами отлова нерадивых студентов, и в т.ч. в документе принимать во внимание то, как они работают на практике, эти самые программы.


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: yuriyah от 26 Ноября 2005, 14:57:25
Нет, как задачу поставили, так и решал ее. Про автоматизацию выявления нарушений ничего сделать не просили, а и просили бы, не стал бы, наверное.


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Николай Николаевич Федотов от 30 Ноября 2005, 15:19:51
Интересно мнение профессионалов и людей имеющих дело с такими нарушениями, по поводу систем автоматизированного поиска нарушений авторского права в сети Интернет...

Вот вам мнение работника провайдера, который ежедневно получает сгенерированные роботами жалобы на "нарушения".

Поначалу пытался разбираться. Потом понял, что ни одна программа не в состоянии правильно оценить степень контрафактности или "плагиатности" текстов и изображений. Однако подобных пионерских программ и чудаков, пытающихся их использовать всё больше. Поэтому все автоматически генерированные жалобы автоматически же отправляются в /dev/null.


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Антон Серго от 01 Декабря 2005, 00:11:32
2 ННФ: не в этом дело-то!...
Вот запускаешь ты эту прогу с каким-то своим текстом (типа баек), он (как невод дедушке) приносит тебе 5 ссылок. Идешь и глядишь их: нет, тут не мое, тут мое, но неинтересно, а вот тут мое, да еще и на сайте Газпрома. Ты пишешь иск, получаешь свои 5 млн. рублей и живешь дальше до следующего запуска проги...


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Timon от 01 Декабря 2005, 09:04:29
Поначалу пытался разбираться. Потом понял, что ни одна программа не в состоянии правильно оценить степень контрафактности или "плагиатности" текстов и изображений. Однако подобных пионерских программ и чудаков, пытающихся их использовать всё больше. Поэтому все автоматически генерированные жалобы автоматически же отправляются в /dev/null.

Я полностью согласен с Антоном Геннадьевичем. Ведь речь не идёт о создании автоматической системы. Речь идёт об автоматизации. (Автоматика - решение принимается без человека... Автоматизация - человек принимает решение.)

В медицине прекрасно использкются IT технологии, но при этом никто не пытается создать систему, которая без участия человека будет проводить диагностику, так ещё и направлять человека на операцию... :-) Человек должен (и пока остается) главным звеном, принимающим решения. Возможно потом будут создаваться автоматические системы... но пока я говорю об автоматизации поиска плагиата (опять же я не говорю обо всех объектах авторского права... я говорю исключительно о текстовой информации.) Проблемы фонограмм, видеоданных, изображений... и почего я не рассматриваю (возможно кто-то заинтересуется и этой тематикой)...


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Николай Николаевич Федотов от 01 Декабря 2005, 10:42:29
Вот запускаешь ты эту прогу с каким-то своим текстом (типа баек), он (как невод дедушке) приносит тебе 5 ссылок.

Такая программа уже создана. "Гугл" называется.

Но мысль хорошая. Гугля сего превзойти чтобы англичане над русскими не предвозвышались!


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Stan от 15 Декабря 2005, 16:09:59
Точно помню, что искатель плагиата в США уже создали. Лет пять назад. И кто-то даже ушел с работы, когда вскрылось, что какой-то его доклад на 21% (подумать страшно) — плагиат.

Для разработки алгоритма, ИМХО, порекомендовать тексты перед сравнением сводить к набору символов <а-я, a-z, 0-9>. Все равно поиск предварительный.


Название: Re:Автоматизация поиска нарушений авторских прав в Интернет...
Отправлено: Dimon от 16 Декабря 2005, 13:14:00
Наткнулся на antiplagiat.ru Работоспособность системы не проверял, сайт не изучал. JFYI.