<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
        <channel>
        <title>дубли / Tag search / Русский клуб Joomla</title>
        <link>http://joomclub.net/en/rss/tag/дубли/</link>
        <description><![CDATA[Сайт посвящен Joomla во всех ее проявлениях, мы рассказываем о шаблонах, расширениях, компонентах, плагинах и модулях]]></description>
        <language>ru</language>
        <managingEditor>tena2000@mail.ru</managingEditor>
        <webMaster>tena2000@mail.ru</webMaster>
        <generator>Alto CMS v.1.1.13</generator>
                    <item>
                <title>Боремся с дублями Joomla – 7 эффективных методов</title>
                <guid isPermaLink="true">http://joomclub.net/en/t/26/</guid>
                <link>http://joomclub.net/en/blog/seo/26.html</link>
                <author>seoelle@gmail.com</author>
                <description><![CDATA[<p>В прошлой статье – <a href="http://joomclub.net/blog/seo/14.html" rel="nofollow">Дубли Joomla – причины возникновения</a>, мы поговорили о том, почему они возникают и как их искать. В этой статье расскажу как можно убрать дубли или предотвратить их появление в поисковой выдаче.</p><p>Так как каждый случай индивидуален, рассмотрим самые популярные способы, которые в 99% случаев отлично работают. Можно для себя выбрать что-то одно или использовать в комплексе.</p><p>Хотя все эти способы применимы и к любой другой CMS системе, но я подробно остановлюсь именно на особенностях Джумлы.</p><p>Все эти примеры справедливы если вы включили стандартный SEF и Перенаправление URL в глобальных настройках J.</p><ul><li><em><strong>1. Плагин для Joomla</strong></em></li></ul><p>Первое, что можно сделать, если у вас путаница в урлах, (когда ссылки формируются и от алиаса категории, и от пункта меню) – поставить плагин Shnodoubles от sherza.</p><p>Отличный плагин, справляется со своей задачей на все 100%. После его установки неправильно сформированная ссылка (от алиаса категории) редиректится на правильную (от пункта <a name="cut" rel="nofollow"></a> меню). Скачать этот замечательный плагин, избавляющий от дублей, для Joomla 2.5 можно <a href="http://dl.dropbox.com/u/13153899/HEKIMA/other/shnodoubles_301/J25/new/shnodoubles.zip" rel="nofollow">здесь</a> (ссылка прямая!)</p><p>После активации плагина некоторые дубли просто склеятся.</p><ul><li><em><strong>2. Robots.txt для Joomla</strong></em></li></ul><p>Этот файл идет в стандартном дистрибутиве Joomla, располагается в корне и доступен по ссылке site.ru/robots.txt. Основная цель – он дает инструкции поисковым роботам по индексации сайта. С его помощью можно закрыть некоторые (нужные вам) разделы сайта, также поддерживаются регулярные выражения – можно закрыть отдельные страницы по маске.</p><p>Чаще всего я использую такую инструкцию (в дополнение к тому, что идет в файле по умолчанию):</p><p><pre class="prettyprint"><code>Disallow: /*? #все ссылки, которые содержат этот знак – не индексируются</code></pre></p><p>Всего одна строчка избавляет от большого кол-ва мусора. Это могут быть:</p><ul><li>страницы печати материалов, содержать в урлах также print= или tmpl=component</li> <li>ссылки на rss ленту</li> <li>страницы результатов поиска по сайту</li> <li>также закроет страницы пагинации</li> <li>могут быть и другие варианты, в зависимости от используемых расширений</li></ul><p>Использовать эту строчку или запрещать каждый тип страниц в отдельности – на ваше усмотрение, но имейте в виду, что слишком большой роботс считается полностью разрешающим. Так же стоит проследить, чтобы эта строчка не закрыла что-то важное, например, карту сайта – в таком случае можно прописать: Allow: /путь_до_карты</p><p>Подробнее об использовании robots.txt можно прочитать в помощи Яндекса — <a href="http://help.yandex.ru/webmaster/?id=996567" rel="nofollow">help.yandex.ru/webmaster/?id=996567</a></p><ul><li><em><strong>3. Атрибут rel=«canonical» тега &lt;link&gt;</strong></em></li></ul><p>Использование этого атрибута поможет роботу определить – какие страницы нужно включать в индекс, а какие нет. Если на сайте существуют очень похожие страницы (нечеткие дубли), отличающиеся лишь, к примеру, вариантами сортировки – с начала новые или сортировать по возрастанию, или показывать по 20-30 и т.д., то вы можете использовать этот атрибут. В таком случае нужно будет выбрать одну каноническую страницу, которая и будет ранжироваться, на остальные добавить rel=«canonical» с указанием выбранной страницы – такие документы не попадут в выдачу, робот будет знать, что включать в индекс их не нужно.</p><p>Подробнее, как внедрить rel=«canonical» в Joomla 1.7/2.5 смотрите <a href="http://joomlaforum.ru/index.php/topic,193079.0.0.html" rel="nofollow">здесь</a></p><ul><li><em><strong>4. 301 редирект</strong></em></li></ul><p>Уместно использовать если вы сменили адреса страниц, но документы по-прежнему существуют, т.е вы их не удалили. В таком случае, для правильной склейки рекомендуется использовать 301 редирект в .htaccess – поисковики буду знать, что документ переехал на новый адрес. Такой метод позволяет сохранить и показатели сайта – Тиц и PR.</p><p>301 редирект можно использовать так же и для склейки дублей. Например, всем известные дубли главной страницы сайта на Joomla – это /index.php и алиас пункта меню Главная, допустим, /home или /homepage</p><p>Склеить их довольно просто, открываем .htaccess и вписываем</p><p><pre class="prettyprint"><code>Redirect 301 /index.php http://site.ru/</code></pre></p><p>Или можно сделать 301 редирект на php в индексном файле вашего шаблона</p><p><pre class="prettyprint"><code>&lt;?php<br /> if($_SERVER['REQUEST_URI'] == '/index.php') {<br /> header(&quot;Location: /&quot;,TRUE,301);<br /> exit();<br /> }<br /> ?&gt;</code></pre></p><p>И приведу уже классический редирект с www на без www</p><p><pre class="prettyprint"><code>RewriteEngine On<br />RewriteCond %{HTTP_HOST} ^www.example.ru$ [NC]<br />RewriteRule ^(.*)$ http://example.ru/$1 [R=301,L]</code></pre></p><p>* example.ru замените на свое доменное имя.</p><ul><li><em><strong>5. Мета тег robots</strong></em></li></ul><p>Еще один способ предотвратить индексацию дублей в Joomla – использование мета тега:</p><p><pre class="prettyprint"><code>&lt;meta name=&quot;robots&quot; content=&quot;noindex&quot;/&gt;</code></pre></p><p>На данный момент этот способ эффективнее для Гугла, чем запрещающие инструкции файла robots.txt. К примеру чтобы закрыть от индексации страницы печати и дубль по адресу ?tmpl=component, можно открыть файл component.php в корне вашего шаблона и вписать этот тег в &lt;head&gt;&lt;/head&gt;.</p><p>Чтобы закрыть страницы результатов поиска на сайте с использованием стандартного com_search, можно в index.php шаблона добавить условие</p><p><pre class="prettyprint"><code>&lt;?php if ($option == 'com_search') &nbsp;: ?&gt;<br />&lt;meta name=&quot;robots&quot; content=&quot;noindex&quot;/&gt;<br />&lt;?php endif; ?&gt;</code></pre></p><p>Но вначале необходимо определить переменную</p><p><pre class="prettyprint"><code>$option = JRequest::getVar('option', null);</code></pre></p><p>Сильно углубляться в условия в шаблонах не буду, статья не об этом, надеюсь принцип понятен.</p><ul><li><em><strong>6. Удаление url из панели</strong></em></li></ul><p>Еще один быстрый способ – ручное удаление из панели вебмастера.</p><p>Для Яндекса нужно пройти по адресу – <a href="http://webmaster.yandex.ru/delurl.xml" rel="nofollow">webmaster.yandex.ru/delurl.xml</a></p><p>Для Google — <a href="https://www.google.com/webmasters/tools/home?hl=ru" rel="nofollow">www.google.com/webmasters/tools/home?hl=ru</a></p><p>Остался еще 1 не очень популярный метод по устранению дублей Joomla из выдачи, но мы его тоже рассмотрим.</p><ul><li><em><strong>7. Заголовки X-Robots-Tag</strong></em></li></ul><p>Довольно редкий заголовок, используется чаще зарубежными оптимизаторами, работает он для Гугла. К сожалению, Яндекс пока не комментирует поддержку этого http-заголовка.</p><p>Google рекомендует использовать X-Robots-Tag как альтернативу 5 способу в нашей статье для нетекстового содержания, когда нет возможности использовать мета-тег.</p><p><pre class="prettyprint"><code>HTTP/1.1 200 OK<br />Date: Tue, 25 May 2010 21:42:43 GMT <br />...<br /> X-Robots-Tag: noindex <br />...</code></pre></p><p>Как видите, способов убрать дубли контента Joomla множество, вы должны хотя бы примерно понимать как работает каждый их них, чтобы выбрать наиболее подходящий вариант и применить к своей ситуации.</p>]]></description>
                <pubDate>Sat, 15 Sep 2012 15:36:51 +0400</pubDate>
                            </item>
                    <item>
                <title>Дубли в Joomla - причины возникновения и частые ошибки</title>
                <guid isPermaLink="true">http://joomclub.net/en/t/14/</guid>
                <link>http://joomclub.net/en/blog/seo/14.html</link>
                <author>seoelle@gmail.com</author>
                <description><![CDATA[<p>Часто можно слышать про дубли в CMS Joomla, многие жалуются, в общем — насущная проблема, сегодня поговорим об этом. Разберем что такое дубли, какие они бывают и от чего возникают, а также как их искать и каково отношение поисковых систем к дублям.</p>
<u><strong>Дубли — что это?</strong></u>
<p>Дубли контента — это одинаковые по своему содержанию документы на вашем сайте, доступные по разным url-адресам. На самом деле дублями страдают многие популярные CMS системы и Joomla здесь не исключение. Все эти одинаковые, по своему содержанию, страницы безвредны до тех пор, пока не будут проиндексированы поисковыми роботами. Главное следить за индексацией и своевременно предпринимать действия по удалению этих страниц из выдачи, но лучше продумать все наперед и избежать возникновения подобных ситуаций.</p>
<p>Основной причиной возникновения дублей в Joomla является неправильная структура сайта. Прежде всего вы должны продумать иерархию категорий и пунктов меню с расчетом на будущее. Частично от возникновения дублей вас спасет <a name="cut" rel="nofollow"></a> создание пунктов меню абсолютно на всё – на каждую категорию и каждый материал сайта.</p>
<p>Разберем подробнее основные ошибки. Предположим у вас есть категория «Новости», а в ней еще несколько подкатегорий – «Политика», «Экономика» и т.д., а материалы вы привязываете непосредственно к дочерним категориям. Если вы создадите пункт меню только на подкатегории, вроде — «Политика», то ссылки могут быть такими (до материала):</p>
<p><em>Site.ru/ politica/23-material </em></p>
<p><em>Site.ru/1-novosti/politica/23-material </em></p>
<p><em>Site.ru/1-novosti/2-politica/23-material </em></p>
<p><em>Site.ru/index.php?option=com_content&task=view&id=23&Itemid=1 </em></p>
<p>И так далее, вариантов формирования адресов множество – всё это будет копиями одной и той же статьи. Это пример как делать не стоит.</p>
<p>Также поисковик может проиндексировать технические копии документа, они обычно доступны по ссылкам «Печать», «PDF», «Отправить другу».</p>
<p>Постарайтесь на начальном этапе, еще при создании сайта, продумать его развитие – определить главные категории и подкатегории, а затем по мере роста вашего сайта ничего не меняя уже в сложившейся структуре, просто добавлять необходимые дополнительные разделы сайта. Помните, что реструктуризация сайта в самый пик развития – тяжелейший удар, который может откинуть вас на месяцы, а то и годы назад. По сути, часть страниц (или все) изменят свои адреса, что повлечет за собой неминуемое снижение позиций в поисковой выдаче и посещаемости.</p>
<u><strong>Как поисковики узнают о дублях?</strong></u>
<p>Обычно причиной служат многочисленные модули и/или компоненты для Joomla, которые вебмастера устанавливают на свой сайт. Пример – сторонний модуль новостей на главной, который и выдает разные адреса. Иногда такие дубли можно увидеть даже в карте сайта, например, если установлен Xmap.</p>
<p>Если ваш сайт уже проиндексирован, то отыскать дублирующийся контент не составит труда – стоит лишь скопировать пару уникальных предложений со страницы материала и вставить в кавычках в строку поиска Яндекса или Google. Если сайт еще не проиндексирован, то можно попробовать воспользоваться бесплатной программой – XENU (актуально, если сайт не большой), она найдет все возможные пути на сайте.</p>
<u><strong>Кому мешают дубли, и почему мы с ними боремся?</strong></u>
<p>Во-первых, поисковики не любят и стараются не индексировать сайты с большим количеством одинаковых страниц – полезность их для поиска весьма сомнительна.</p>
<p>Во-вторых, при продвижении сайта по определенным ключевым словам отбираются наиболее релевантные страницы, оптимизируется контент на каждой из них, проводится работа над внешним и внутренним ссылочным – и если такие страницы имеют дубли, то шанс смены поисковой машиной, в один из апдейтов, выбранной нами релевантной страницы – очень велик ( страница в выдаче заменяется дублем, что сопровождается резким падением позиций и проседанием траффика).</p>
<p>Итак, причины и следствия разобрали, в следующей статье расскажу как бороться с дублями в Joomla и можно ли их окончательно победить.</p>]]></description>
                <pubDate>Wed, 12 Sep 2012 03:59:40 +0400</pubDate>
                            </item>
            </channel>
    </rss>
