<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
  <title>my.ukrweb.info УКРВЕБ ІТ веблог</title>
  <subtitle>окремий погляд на ІТ</subtitle>
  <link rel="alternate" type="text/html" href="http://my.ukrweb.info/ru/node/117"/>
  <link rel="self" type="application/atom+xml" href="http://my.ukrweb.info/ru/node/117/atom/feed"/>
  <id>http://my.ukrweb.info/ru/node/117/atom/feed</id>
  <updated>2008-12-28T20:53:01+02:00</updated>
  <entry>
    <title>Спам технології, дві сторони медалі</title>
    <link rel="alternate" type="text/html" href="http://my.ukrweb.info/ru/node/117" />
    <id>http://my.ukrweb.info/ru/node/117</id>
    <published>2008-03-04T01:08:33+02:00</published>
    <updated>2008-12-28T20:53:01+02:00</updated>
    <author>
      <name>podarok</name>
    </author>
    <category term="ukrweb" />
    <category term="ІТ" />
    <category term="безпека" />
    <category term="зворотні посилання" />
    <category term="пінгбек" />
    <category term="спам" />
    <category term="трекбек" />
    <category term="українська" />
    <summary type="html"><![CDATA[    ]]></summary>
    <content type="html"><![CDATA[<p>&lt;!--break--><br />
<div class="toc">
<div class="toc-title">Table of Contents [<a href="#" class="toc-toggle">hide</a>]</div>
<div class="toc-list">
<ol>
<li><a href="#Prolog">Prolog.</a></li>
<li><a href="#i">Рiзновиди спаму.</a>
<ol>
<li><a href="#emailspam">Почтовий спам - email-spam</a>
<ol>
<li><a href="#spyware">Метод 1 - spyware</a></li>
<li><a href="#adware">Метод 2(доброякісний) - adware</a></li>
<li><a href="#spywareadware">Метод 3(комбінований) - spyware+adware</a></li>
</ol>
</li>
<li><a href="#spam">Як генерується spam</a></li>
<li><a href="#internetspam">Спам в Інтернет - internet-spam</a>
<ol>
<li><a href="#trackbackspam">Спам в коментарях, trackback spam</a></li>
<li><a href="#Refererspampingback">Referer spam та спам в pingback-ах</a></li>
<li><a href="#trackback">Спам в trackback-ах</a></li>
</ol>
</li>
<li><a href="#blogspam">Блогспам - blogspam</a>
<ol>
<li><a href="#-1">Як боротись?</a></li>
<li><a href="#-2">Як не боротись!</a></li>
<li><a href="#-3">Як спамити?</a></li>
</ol>
</li>
<li><a href="#Spam">Spam в рейтингах</a>
<ol>
<li><a href="#-4">Як боротись?</a></li>
</ol>
</li>
</ol>
</li>
<li><a href="#Epilog">Коротко Epilog</a></li>
</ol>
</div>
</div>
<h1 id="Prolog">Prolog.</h1>
</p><p> Привіт... <BR />Довго тримав в собі дану статтю, в основному вивчаючи людську психологію, переглядаючи можливості всіляких фільтрів та антиспам сервісів, а також читаючи коментарі до різноманітних антиспам флешмобів в інтернеті...  <BR /><BR />Отже - спам. Що це - розповідати було б смішно і п-а-д-о-н-к-і написали б - архі-б-а-я-н. <BR />А розповім я про технології, так би мовити spam inside. <BR /><BR /><BLOCKQUOTE>Знаю, що глянувши на лічильники даного веблогу можна одразу почати недовіряти тексту і Ваше право робити з цією інформаціює все, що Вам захочеться.  <BR /><BR /></blockquote><BR />Вернусь до наших баранів. <BR />На цю статтю частина людей буде дивитись із боку боротьби проти спаму, а частина - спамери. <BR /><STRONG>І тих і тих я поважаю, Ви обрали свою позицію усвідомлено. </strong><BR />Враховуючи це - буду описувати методи спаму і методи антиспаму, хоча я особисто рахую, що найкращий метод антиспаму - премодерація+постмодерація одночасно.  <BR /><br />
<h1 id="i">Рiзновиди спаму.</h1>
</p><p><UL><LI>поштовий спам</li><LI>спам в трекбеках</li><LI>спам в пінгбеках</li><LI>referrer спам</li><LI>спам в коментарях</li><LI>блогспам</li><LI>пошуковий спам</li><LI>спам в рейтингах(TOP спам)</li><LI>спам в месенджерах</li><LI>javascript спам</li><LI>антиантиспам</li><LI>клоакінг</li><LI>rss спам (для пошуковиків)</li><LI>будь-які модифікації всіх вищеназваних</li></ul>Список неповний і буду радий, якщо мені допоможуть його "наповнити".<BR />Загалом можна переозначити поняття спаму... Це вже не тільки електронна пошта... Це щось небажане...<BR /><BR /><br />
<h2 id="emailspam">Почтовий спам - email-spam</h2>
</p><p>Думаю з цим терміном знайомі всі користувачі інтернету... Просто небажана пошта, реклама, яку не замовляли, вкладення з вірусами. Особліво небезпечні варіанти ті, які втираються в довіру до користувача - в ідеальних випадках, якщо лист приходить наче від Вашого друга, або знайомого, іноді навіть із реальною електронною адресою друга... З цим я зустрічався в англомовному сегменті, де спамери набагато досвідченіші за наших і формують бази електронних адрес та зв'язки між ними.<BR /><br />
<h3 id="spyware">Метод 1 - spyware</h3>
</p><p><UL><LI><STRONG>Простий</strong> - Генерується електронний лист в основному автоматом, з використанням лівих електронних адрес, іноді з посиланням "Unsubscribe", яке приводить на якусь сторінку, що для спамера відображає факт - електронна адреса активна... Ніхто звичайно Вас не відпише, більше того - про Вас з допомогою спеціальніх скріптів можуть дізнатись додаткову інформацію(в основному GEO).</li></ul><BLOCKQUOTE>Росзилається такий спам в основному на дуже велику кількість електронних адрес з метою збору статистики.<BR /><BR /></blockquote><UL><LI><STRONG>Складний</strong> - з метою збору цільової аудиторії та викрадання інформації. В даному випадку розсилаються сторінки, що мають характер троянських коней. Можуть повністю імітувати роботу відомих вебсервісів (Paypal, MSN, MySpace etcetera). В цьому випадку Вас намагаються "взяти на понт" і заставити Вас ввести персональні дані після переходу по посиланню...</li></ul><UL><LI><STRONG>Листи щастя. </strong>Одна із методик збору реальних електронних адрес. В такому листі може бути зовсім безневинна інформація в вигляді набору класних картинок, анекдотів etcetera. Спамер відсилає таке повідомлення в надії, що його будуть багато разів пересилати (Forward) багатьом отримувачам, в результаті йому(спамеру), завжди будуть приходити копії з достатньою кількістю реальних електронних адрес.</li></ul><UL><LI><STRONG>Спам-антиантиспам </strong>- лист складається з двох частин - текстової та графічної. Текстова частина може бути прихована методами HTML із розміром шрифта в 1 пункт, а головну інформацію несе відповідно картинка.</li></ul><DIV align="center"><A target="_blank" href="http://my.ukrweb.info/files/antiantispam.png"><IMG width="398" lang="uk-UA" height="306" align="middle" alt="Анти антиспам - приклад" longdesc="http://my.ukrweb.info/спам" src="http://my.ukrweb.info/files/antiantispam.png" /></a></div><BLOCKQUOTE>Відмічати дане повідомлення як спам в фільтрах необхідно лише після перевірки текстової частини... В основному там текст, який ніколи не вважається спамом і відмітивши цей лист як спам Ви послабите фільтруючі властивості Вашого антиспам фільтра.<BR /><BR /></blockquote><UL><LI><STRONG>Антифільтр </strong>- спам, який пробиває ваш фільтр різноманітними методами. Один з них - наведений прикладом више, інші:<UL><LI>Некоректне вказування кодування в листі, щоб ваш фільтр не знайшов "спам" слів</li><LI>Приховування тексту методами html</li></ul><DIV align="center"><A target="_blank" href="http://my.ukrweb.info/files/antiantispam2.png"><IMG width="328" lang="uk-UA" height="413" align="middle" alt="Антиантиспам" longdesc="http://my.ukrweb.info/спам" src="http://my.ukrweb.info/files/antiantispam2.png" /></a></div><UL><LI>Використання в тексті популярних слів (Google, Microsoft, Compaq) англійською та подальший текст - Російською.</li><LI>Навчання спамерами відомих фільтрів з метою зараження центрального репозиторія (Akismet, httpbl etcetera).</li></ul></li></ul><br />
<h3 id="adware">Метод 2(доброякісний) - adware</h3>
</p><p><UL><LI><STRONG>Реклама цільових продуктів</strong>. Спамери, заробляючи гроші, знаходять клієнтів, що присилають Вам банальну рекламу. В основному проблем із такими листами немає.</li><LI><STRONG>Спам повідомлення через Сервіси коротких повідомлень</strong>. Думаю кожен власник одного з ICQ, YahooIM. MSN IM, Jabber IM etcetera хоч один раз в житті зустрічався із повідомленням, яке неслов собі спам.</li><LI><STRONG>Спам-посилання</strong> - приходить лист із Одним реченням-посиланням, що намагається привернути увагу цільової аудиторії.</li></ul><br />
<h3 id="spywareadware">Метод 3(комбінований) - spyware+adware</h3>
</p><p>Тут вже спамери роблять різноманітні комбінації скажімо безневинної реклами та вірусу, або Листи щастя із словом-реченням, яке точно має характер спаму(воно візуально може навіть не відобразитись у Вас, приховане методами HTML) і націлене не пробій Вашого антиспам фільтру задля того, щоб наступне - реально спам повідомлення проскочило та відобразилось у Вас.<BR /><BR /><br />
<h2 id="spam">Як генерується spam</h2>
</p><p> <UL><LI>Через недосвідченість деяких адмінів, що залишають відкритими почтові сервери, спамери можуть використовувати їхні сервери для розсилання <EM>( Мав практику аналізу такого сервера )</em></li><LI>Використовуючи віруси трояни, а також rootkit-и спамери встановлюють на клієнстські машини(Windows) почтові сервери і з цих машин розсилають почту <EM>(Сам був нещодавно свідком такого взлому, безпосередньо в себе в офісі).</em></li><LI>Використовуючи помилки в відомому програмному забезпеченні вебсерверів та вебпрограм можуть ламати їх та записувати на сайт спеціальні скрипти, з допомогою яких можуть відправляти спам прямо з Вашого вебсайту. <EM>( Мав практику безпосередньо на своєму вебхостінгу в минулому, коли зловмисник через дірку в відомому cms залив на вебсайт php скрипт)</em></li><LI>Купляється якийсь пробний і дешевий хостінг, через який розчисається спам аж до моменту, поки його не закриють.</li></ul><br />
<h2 id="internetspam">Спам в Інтернет - internet-spam</h2>
</p><p>Я спеціально відділив окремим пунктом цей спам, бо НМД - він проходить найбільш активну стадію розвитку зараз в Українському сегменті(і не тільки). Враховуючи доступну монетизацію інтернету, кожен більш-менш обізнаний з комп'ютерним світом починає оптимізацію своїх ресурсів, з яких заробляє гроші.<BR /><br />
<h3 id="trackbackspam">Спам в коментарях, trackback spam</h3>
</p><p>Думаю кожен вебсервіс, в ядрі якого присутня вільна можливість дописування інформації відвідувачами, мав практику отримання такого спаму.<BR /><BR /><br />
<h4 id=""><STRONG>Мета спаму</strong></h4>
</p><p><STRONG>Перша Мета</strong> - Посилання на сторінку, рейтинг якої спамер намагається підвищити. <BR />Останнім часом з'явились дуже складні методи спаму, в результаті яких додається коментар дуже схожої тематики, в основному вручну, іноді дуже навіть по темі в розрахунку на те, що модератор не забанить даний допис і посилання буде працювати. Іноді посилання публікується звичайним текстом, в розрахунку на те, що користувачі перейдуть по ньому вручну.<BR />Як боротись з таким спамом? Нажаль лише постмодерація + чорний список посилань та ключових слів.<BR /><STRONG>Інша мета</strong> - антиантиспам. Якщо Ви натиснете на такому повідомленні - "помітити як спам", Ваш фільтр послабить свою пильність.<BR /><BLOCKQUOTE>Заборонено використання автоматичних фільтрів типу Akismet, httpbl, bayesian базованих а також інших роботів, які аналізують контент та складають імовірність спаму. Якщо ви на такому повідомленні натиснете спам - Ваш фільтр почне ловити нормальні повідомлення. <BR />Якщо ж Ви все-таки хочете покластись на "розум" робота - вмикайте премодерацію для повідомлень, впізнаних роботом і у випадку, якщо корисне повідомлення впізнано як спам - вчіть робота відповідним алгоритмом - "не спам", а повідомлення, що несе в собі характер спаму - просто видаляйте, або якщо воно несе в собі корисну інформацію - видаляйте ту його частину, що є безпосередньо спамом<BR /><BR /><BR /></blockquote><br />
<h3 id="Refererspampingback">Referer spam та спам в pingback-ах</h3>
</p><p>Даний вид спаму розрахований на цільову аудиторію - власників вебсервісів, що мають доступ до статистики... В цьому випадку спамер відсилає в заголовках свого інтернет браузера поле Referer в якому вказує рекламне посилання з надією, що Ви, як користувач, що переглядає статистику, перейдете по посиланню. <BR /><DIV align="center"><A target="_self" href="http://my.ukrweb.info/files/referer_spam.png"><IMG width="403" lang="uk-UA" height="252" align="middle" alt="Реферер спам" longdesc="http://my.ukrweb.info/спам" src="http://my.ukrweb.info/files/referer_spam.png" /></a></div><STRONG>Боротись з даним методом</strong> можна аналогічно - робити перенаправлення на вебсайт рекламодавця 8))). Хоча в більшості випадків такий спам генерується роботом і швидше за все на Ваше перенаправлення не буде жодної реакції.<BR /><BR /><A lang="uk-UA" target="_self" name="Спам через referer" href="http://my.ukrweb.info/spam-tehnologiyi-dvi-storoni-medali-uk#comment-155"></a><BR /><br />
<h3 id="trackback">Спам в trackback-ах</h3>
</p><p>Даний вид спаму розповсюджений в основному в англомовному сегменті, через необізнаність користувачів - що таке трекбеки. Що воно є - можете прочитати на сторінках даного веблогу, а я продовжу розповідь про спам. <BR />Спамери сканують роботами підряд всі вебсторінки на наявність rdf тегів і колекціонують їх у відповідні бази даних. Після цього відкритим методом посилають <EM><STRONG>trackback ping POST</strong></em> пакет з надією, що модератор не побачить спам повідомлення і розмістить посилання на своєму ресурсі.<BR /><STRONG>Боротьба</strong> - виключна премодерація + алгоритм Bayesian підключаєм в випадку з'явлення великої кількості корисних trackback-ів, але разом із режимом <EM>nofollow </em>або <EM>redirect </em>до моменту <EM>approve </em>(дозволу на повноцінне публікування)<BR /><br />
<h2 id="blogspam">Блогспам - blogspam</h2>
</p><p>Даний метод спаму націлений на пошуковиків та власників блогів та вебсервісів з присутніми коментарями. Ну пошуковики хай розбираються самі, а блогери практично в 100% потрапляють в пастки. Спамер досить часто - <EM>майже</em> нормальна людина, що намагається замилити очі іншим, створивши, як правило, <EM>паразитуючий блог</em>(агрегатор постів популярних блогів), або <EM>блог-клоакінг</em>, який відображається Вам, як аналізуючому посилання(із відповідним referer) із відповідною тематикою та рекламою, дуже схожою до Вашої, але пошуковим сервісам він представляється як набір <EM>sape</em> -подібних адрес, для рекламування та заробітку.<BR /><br />
<h3 id="-1">Як боротись?</h3>
</p><p><UL><LI>В обов'язковому порядку перевіряйте посилання в новому вікні браузера, вводячи адресу вручну, або копіюючи її з іншої сторінки. Таким чином на маленький відсоток зменшиться ймовірність підміни сайту в залежності від referer. Можна спробувати також замінити User-Agent заголовки на один з відомих роботів ( Google, Yahoo, ia_archiver тощо ), тоді ймовірність покращиться.</li><LI>Використовуючи spam-notspam фільтри натискаєте на правильних повідомленнях notspam</li></ul><br />
<h3 id="-2">Як не боротись!</h3>
</p><p><UL><LI><STRONG>Не вмикайте автоматичне видалення повідомлень, якщо воно впізнане як спам </strong>- ризикуєте потрапити в повну тишу, через старання зловмисників, які навчать Ваш фільтр видаляти все. Прикладом є блог <a href="http://ribel.org.ua" title="http://ribel.org.ua">http://ribel.org.ua</a>, в базу фільтра BadBehavior  якого потрапила моя робоча IP адреса (через вірус на одній з машин корпоративної підмережі, що розсилав спам) і всі повідомлення банально не отримуються власником. <EM><STRONG>Завжди давайте шанс повідомленням бути переглянутим</strong></em> перед <EM><STRONG>ручним</strong></em> видаленням, бо існує ймовірність помилкового спрацьовування.</li><LI><STRONG>Не розповсюджуйте глобально Вашу антиспам базу даних</strong>, як це роблять Akismet, httpbl, BadBehavior - Ви можете згарячу рубанути одне неспам повідомлення, а в результаті тисячу користувачів одного з інтернет провайдерів не будуть мати доступ до Вашого сайту і до великої кількості вебсайтів, які повірили глобальній базі даних, що не була перевірена <EM><STRONG>англомовними </strong></em>адміністраторами.</li><LI><STRONG>Не пишіть відкрито списки спам сайтів</strong>, які зустрічаються на Вашому сайті - зловмисники можуть відповісти Вам, написавши тисячі повідомлень від імені Вашого вебсайту на інших блогах і в результаті Ваш сайт потрапить в спамерську базу.</li></ul><br />
<h3 id="-3">Як спамити?</h3>
</p><p><UL><LI>Коментуючи текст статті - пишіть нормальні коментарі, Нічого ж не вартує реально відповісти по темі так, щоб ніхто не запідозрив, що Ви - спамер. В результаті всі будуть довольні.</li><LI>Не намагайтесь Вписувати в поле імені користувача текст для розкрутки - в 99% його сприймуть як спам. Пишіть реальні або віртуальні дані - Скажімо Василь Іванович. Тоді Вас можуть не запідозрити, а пошуковики сприймуть Ваше посилання нормально.</li><LI>Не вкладайте в саме повідомлення посилання більше чим 1 - Запідозрять однозначно! Навіть одне - сприймається людиною дуже негативно.</li></ul><BLOCKQUOTE>Гм... Після прочитання Сам почав розуміти, що результатом виконання цих трьох правил буде <EM><STRONG>Нормальне і живе повідомлення</strong></em>, що по суті своїй <EM>не буде спамом</em>.<BR /><BR /></blockquote><br />
<h2 id="Spam">Spam в рейтингах</h2>
</p><p>Маловивчений вид, але ним користуються багато людей... Скажімо <BR /><UL><LI><EM><STRONG>Партнерські обміни лінками</strong></em>, в яких список формується в залежності від переходів від сайтів партнерів..</li></ul><BLOCKQUOTE>В цьому випадку спамери намагаються наклікати переходи до достатнього рівня, щоб відображатись в списку. <BR /><BR /></blockquote><UL><LI><EM><STRONG>TOP коментаторів.</strong></em></li></ul><BLOCKQUOTE>Якщо у Вас на блозі присутній такий блок, то після попадання в нього спамер "заспокоюється" і перестає коментувати. <BR /><BR /></blockquote><UL><LI><EM><STRONG>ТОР вебсайтів.</strong></em></li></ul><BLOCKQUOTE>Каталоги, рейтинги, голосування без реєстрацій - всі ці технології компрометували себе через можливість накручування різноманітними методами та скриптами, а також помилками і дірами в програмному забезпеченні, що підраховує голоси.</blockquote><br />
<h3 id="-4">Як боротись?</h3>
</p><p>Якщо аналізувати статистику переходів - то вони зроблені на протязі короткого часу і після досягнення результату закінчуються на весь наступний період до оновлення лічильників.<BR />Взагалі будь-яка боротьба - полягає на human-базованому вивченні технології накруток, спаму, антиспаму, антиантиспаму тощо.<BR />В Українському сегменті боротьба із глобальним спамом закінчується на банальній логічній україномовній Captcha, в зв'язку із малорозвинутістю  спеціальних спам-мереж та сервісів, в яких взломом алгоритмів займаються люди, отримуючи малесенький цент за розшифровування Captcha картинок. <BR />Але не пройде і 1-2 роки, як і ми будемо заражені від нашого Молодшого Брата - Росії, які хоч і прикидуються, що не розуміють Української, але все ж вміють гарно спамити.<BR /><BR /><br />
<h1 id="Epilog">Коротко Epilog</h1>
</p><p>Якщо хочете, щоб відкидались спамери, що полюють за посиланнями - <EM><STRONG>зробіть посилання з Вашого вебсайту</strong></em> в частинах, до яких мають доступ користувачі без Вашого відома - <EM><STRONG>неефективними </strong></em>(redirect), тоді Ви будете мати справу лише з цільовою аудиторію. <BR />Крім того <EM><STRONG>ведіть білий список,</strong></em> заохочуйте тих коментаторів, що коментують не тільки заради Власної вигоди та розкрутки власного сервісу - ставте на їхніх посиланнях rel="follow index".<BR />Успіху Вам і сподіваюсь отримати українські неспам <A lang="uk-UA" title="Що таке трекбек" name="Трекбеки" target="_blank" href="http://my.ukrweb.info/trackback-prihovana-tehnologiya-spivpraci-uk">трекбеки</a><BR /> <BR /> Додатково можна почитати про спам<BR /><A lang="ru-RU" target="_blank" name="пише Viruslist.com" href="http://www.viruslist.com/ru/spam/info?chapter=156609070">www.viruslist.com/ru/spam/info</a></p>
    ]]></content>
  </entry>
</feed>
