Сбор данных программирования для SEO исследований

  1. Создать список файлов в каталоге
  2. Настройте среду PHP
  3. Извлечь содержимое с веб-страницы

Наша коммерческая группа Artmisto.net

В прошлом месяце я показывал вам три уловки, которые я использую при сборе данных на веб-сайтах , Я использовал эти методы для загрузки веб-страниц в локальную папку. Сами по себе эти процедуры не являются SEO; однако специалист по поисковой оптимизации, работающий на крупном или корпоративном веб-сайте, должен знать, как это сделать. В этой статье я покажу вам, как:

  1. Составьте список страниц внутри папки
  2. Настройте среду разработки
  3. Открывайте веб-страницы из скрипта и извлекайте данные

Если вы изучите эти процедуры, я уверен, что вы найдете законную возможность использовать каждый из них, вместе или в одиночку.

Создать список файлов в каталоге

Пользователи Mac могут задаться вопросом, почему я пытаюсь узнать, как взять список файлов в каталоге и превратить их имена в текстовый список. На Mac вам просто нужно:

  • Выберите все имена файлов в папке и нажмите Копировать
  • Создать пустой текстовый файл
  • В меню выберите «Правка», затем «Вставить и сопоставить стиль».

В Windows, с другой стороны, нет простого способа сделать это. Вот мой рецепт:

  • Создайте текстовый файл с именем dir.bat
  • В файл введите строку dir / b / o: en> dir.txt
  • Сохраните, закройте, а затем поместите этот файл в каталог, для которого вы хотите список файлов
  • Дважды щелкните файл, чтобы запустить скрипт
  • Файл .bat создаст новый текстовый файл со списком имен файлов

Теперь, когда у вас есть список файлов, давайте откроем один и найдем содержимое, которое вы ищете.

Настройте среду PHP

Если мысль о настройке среды PHP вас пугает, расслабьтесь. Все, что вам нужно, это размещенный веб-сайт или дисковод. Хостинг-аккаунт - это самый простой способ зайти сюда. Он включает в себя PHP, так что все, что вам нужно, это Программа FTP создать подпапку и загрузить файлы скриптов.

Например, я создал простой Привет, мир скрипт на одном из моих сайтов. Если у вас нет размещенного сайта, вы можете создать свою собственную среду Apache с PHP бесплатно с XAMPP , XAMPP устанавливает Apache, PHP, MySQL и некоторые другие программы, которые вместе создают среду разработки на вашем диске. Я держу XAMPP на флеш-накопителе, поэтому у меня всегда есть свои скрипты везде, где есть ПК с USB-портом. После установки XAMPP:

  • Посетите каталог XAMPP и запустите xampp-control.exe
  • Запустите Apache
  • В веб-браузере перейдите на http: // localhost

Пространства сайта помещаются в / xampp / htdocs / как подпапку; например, сценарии находятся в / xampp / htdocs / scripts /. Скопируйте и сохраните следующее как /xampp/htdocs/scripts/hello-world.php:

&lt;? php echo «<html> <head> <title> Hello World </ title> </ head> <body> <p style = \» font-family: \ 'Segoe UI \', Tahoma, Geneva, Verdana, без засечек; размер шрифта: х-большой; цвет: #FFFFFF; цвет фона: # 8E8E17; margin-top: 250px; отступ: 25px 25px 25px 25px; выравнивание текста: center \ ”> Hello World. Сиэтл Зовет. </ p> <p style = \ ”font-family: \ 'Segoe UI \', Тахома, Женева, Вердана, без засечек; размер шрифта: х-большой; цвет: #FFFFFF; цвет фона: # 8E8E17; margin-top: 0px; отступы: 25px 25px 25px; выравнивание текста: center \ ”> Вы можете <a href=\vationjavascript:history.go(-1)\\>> [Вернуться назад] </a> сейчас. &lt;/ p> < / body> </ html>»; ?>

Чтобы запустить скрипт, посетите http: //localhost/scripts/hello-world.php. Помещаете ли вы подпапку в размещенную веб-учетную запись или устанавливаете XAMPP, либо вы будете работать в качестве среды разработки. Я предпочитаю XAMPP на моем флэш-накопителе, потому что я могу сохранять и выполнять файлы без необходимости загружать их.

Извлечь содержимое с веб-страницы

Введите этот скрипт в вашу среду разработки как twitter-follow.php.

&lt;? php $ a [1] = 'http: //twitter.com/seomoz'; $ А [2] = 'HTTPS: //twitter.com/sengineland'; $ А [3] = 'HTTPS: //twitter.com/apple_worldwide'; $ А [4] = 'HTTPS: //twitter.com/microsoft'; $ А [5] = 'HTTP: //twitter.com/smartsheet'; foreach ($ a as $ objectURL) {$ handle = file_get_contents ($ objectURL); if (! $ handle) die («Не удается открыть устройство»); preg_match ('/ (<strong>) (. *) (<\ / strong> подписчики) / i', $ handle, $ последователи); эхо «\» ». $ objectURL. «\»; \ »». $ последователей [2]. «\» <br /> »; сон (0,5); }?>

Теперь запустите его: http: //localhost/scripts/twitter-followers.php или там, где находится ваша среда разработки. Он должен выводить файл с разделителями с каждым URL-адресом Twitter и количеством подписчиков в аккаунте. Вот что происходит в этом сценарии.

$ А [1] = 'HTTP: //twitter.com/seomoz';

Каждая из строк со 2 по 6 определяет переменную как адрес Twitter. Обратите внимание на [1], [2], [3] и т. Д. Это позволяет легко написать формулу в Excel, которая будет записывать строку кода PHP для каждого адреса Twitter. $ а [1] = 'HTTP: //twitter.com/seomox';

foreach ($ a as $ objectURL) {}

Это создаст цикл, который будет проходить через все переменные $ a [], которые вы создали. С каждым проходом он присваивает содержимое $ a [] $ objectURL.

$ handle = file_get_contents ($ objectURL);

Эта строка читает веб-URL и сохраняет разметку HTML в $ handle.

preg_match ('/ (<strong>) (. *) (<\ / strong> подписчики) / i', $ handle, $ последователи);

Здесь происходит волшебство. Это команда Perl Regular Expression Match.

    • Он проверяет разметку HTML в $ handle и записывает результаты в $ последователи
    • Он хранит что-либо между скобками () в $ последователей
    • Начало / и конец / - начало и конец теста
    • . * - это регулярное выражение, которое соответствует любому набору или длине символов, в данном случае между <strong> и </ strong> подписчиками.
    • Символ \ - это побег. Помещенный перед зарезервированным символом, таким как / или *, он сообщает PHP, что он должен воспринимать его как обычную или действительную букву, цифру или пунктуацию
    • Маленький i после второй / указывает соответствующей команде игнорировать регистр букв или не учитывать регистр

эхо «\» ». $ objectURL. «\»; \ »». $ последователей [2]. «\» <br /> »;

Эта строка печатает результаты. Обратите внимание на escape-символы перед напечатанными кавычками. Также обратите внимание на 2 в $ последователей [2]; это соответствует второму набору скобок.

Зная, что вы узнали, как вы думаете, что будет делать эта строка кода?

preg_match ('/ (<div class = \ ”fsm fwn fcg \”>) (. *) (лайки ·) (. *) (об этом говорят <\ / div>) / i', $ handle, $ последователи) ;

Если вы сказали «соответствуйте Facebook, как говорите», вы правы. Однако, если вы попробуете это, это не сработает. Зачем? Потому что Facebook тестирует агент пользователя, а скрипт не предоставляет его. Вот случай, когда вы можете вернуться к Первая часть , напишите макрос, который загрузит веб-страницы на ваш локальный компьютер, а затем получит нужные данные. В вашем скрипте просто измените URL-адреса на файлы.

$ А [1] = 'C: \ файл-1.html';

PHP прекрасно способен отправлять пользовательский агент; Однако вы можете попасть в ловушку по разным причинам. Другим примером является требование входа в свою учетную запись на таких сайтах, как Open Site Explorer.

preg_match ('/ (subdomain_mozrank \ ”:) (. *) (, \” subdomain_mozrank_raw) / i', $ handle, $ последователи);

Вместо изучения PHP для каждой ситуации iMacros, которой я поделился в прошлом месяце, сразу же поможет вам. Если вы хотите пойти дальше, прочитайте эти страницы и изучите регулярные выражения:

Существует целый мир обучения там. Это тоже не обязательно должен быть PHP. Python, Ruby, PERL и другие будут работать. Проведите исследование, просмотрите некоторые учебники и поговорите с друзьями-разработчиками. Сделайте выбор, который подходит именно вам.

Предостережение: некоторые прямые цитаты могут быть заменены на умные. Обязательно используйте прямые кавычки в своей кодировке.

Мнения, выраженные в этой статье, принадлежат автору гостя и не обязательно относятся к Search Engine Land. Штатные авторы перечислены Вот ,


Об авторе

Похожие

SEO
SEO или «поисковая оптимизация» - это термин, который широко используется и становится вопросом для веб-сайтов или интернет-магазинов. Вообще говоря, это позиционирование веб-страницы, и, естественно, все пытаются показать себя впереди. Для сайта, который действительно хорошо позиционирован и оптимизирован,
SEO отчеты
SEO-отчет предоставит неоценимую информацию о вашем текущем веб-сайте, вашем онлайн-бизнесе, ваших клиентах и ​​поможет определить стратегию, которая
SEO копирайтинг
Последнее обновление: 28 февраля 2019 года в 11:26 В чем разница между SEO копирайтингом и копирайтингом? Есть ли разница в Стратегия содержания ? Разница в стиле письма? Где
Видео SEO
Видео, которые вы размещаете на своем сайте, можно классифицировать для отображения в результатах обычного поиска. Обладая базовыми знаниями о SEO-видео, пользователи могут находить ваши видео в результатах поиска и привлекать внимание к содержанию ваших видео. Видео с сайта www.leanwithluke.co.uk было классифицировано
Аутсорсинг SEO
Аутсорсинг SEO сервисов для повышения вашего рейтинга в поисковых системах в различных поисковых системах, таких как Google, Yahoo, Bing. Мы поможем вам сделать ваш сайт живым и прибыльным с помощью гарантированных услуг SEO сайта. Наш гарантированный SEO-сервис - это олицетворение нашего опыта и уверенности в нашей способности высоко оценивать сайты в различных основных поисковых системах. Наш профессиональный эксперт по SEO предоставляет лучшие и доступные профессиональные услуги по поисковой
SEO консультант
SEO считается самым ярким будущим для онлайн-бизнеса. Успешное внедрение лучших методов поисковой оптимизации может изменить состояние компании и обеспечить желаемые результаты. Основная цель SEO-консультанта в Индии - повысить рейтинг в поисковых системах Google, Yahoo и Bing. Роль SEO-консультанта становится важной в настоящее время, потому что все ведущие сайты социальных сетей, такие как Facebook, Twitter и Google Plus, дают отличные результаты.
Русский SEO
В ExtraDigital мы имеем большой опыт работы с Яндексом, который является ведущей поисковой системой в России и на других рынках кириллицы. Яндекс - лучшая SEO-платформа для любого российского бизнеса, и в ExtraDigital мы знаем, как сделать ваш сайт видимым в Яндексе! Мы обладаем огромным опытом и знаниями в области SEO и маркетинга в России, чтобы помочь вам и вашей организации развиваться.
SEO Компания Великобритания - Position1SEO
SEO-компания в Великобритании может не подойти вам, когда вы впервые строите свой бизнес в Интернете. Фактически, многие люди думают, что все, что им нужно сделать, - это создать веб-сайт, и клиенты придут к ним. К сожалению, это не случай. Рассмотрим обширность интернета и количество предприятий
SEO пакеты 2019 - многоязычные SEO пакеты
Поисковая оптимизация (SEO) имеет жизненно важное значение для расширения вашего онлайн-бизнеса. Это означает, что вам нужно получить лучшие услуги SEO по правильным ценам, которые привлекают большинство клиентов по самым низким ценам. Вы можете начать с расширения клиентской базы и увеличения продаж, приобретая экономичные пакеты SEO. Различные типы представленных SEO-пакетов основаны на количестве ключевых слов и ключевых фраз, для которых будет оптимизирован ваш сайт, и первых страницах
Как создать контрольный список SEO
SEO является чрезвычайно важным инструментом, так как хорошо применяемое приложение способно оптимизировать и улучшить позиционирование веб-сайта на страницах с органическими результатами в поисковых системах. Чтобы этот инструмент был эффективным, мы разделили несколько советов о том, как создать контрольный список SEO.
SEO условия объяснил
Поисковая оптимизация включает в себя ряд терминов, которые не всегда понятны всем. Тем не менее, важно понимать их, когда вы хотите начать с SEO. Вот почему я составил основной список ниже, который объясняет многие из этих слов. Если есть условия, которые я забыл, пожалуйста, дайте мне знать, и я буду рад завершить список. SEO SEO - это аббревиатура для поисковой оптимизации. Проще говоря, SEO состоит из ряда усилий, направленных

Комментарии

Со своей стороны я решил перейти к науке о SEO данных (видео) , А как насчет других специалистов по SEO?
Добро пожаловать! Я Lym Sung Peter Kim, и я уверен, что вы попали сюда по поиску «SEO» или по одному из наших видео на YouTube. Знаете ли вы, Гавайи SEO , Оаху SEO , а также
Является ли владелец малого бизнеса действительно опытным SEO или он потерян в сети путаницы SEO?
Является ли владелец малого бизнеса действительно опытным SEO или он потерян в сети путаницы SEO? Я бы сказал, что оба. Он знает достаточно, чтобы сделать его опасным. Я обычно вижу, что используются очень старые методы SEO и много раз черная тактика SEO. Дублированный контент и несколько URL-адресов являются популярными тенденциями, а также жирным шрифтом и заполнением ключевых слов. В то время как дублированный контент, жирные слова и ключевые слова занимают первое место в списке наиболее
Все еще задаетесь вопросом, будет ли ваш сайт оптимизирован для SEO, или задаетесь вопросом, как построить стратегию SEO?
Все еще задаетесь вопросом, будет ли ваш сайт оптимизирован для SEO, или задаетесь вопросом, как построить стратегию SEO? Мы могли бы помочь с бесплатный онлайн маркетинговый аудит , SEO услуги в и из Бирмингема или сделанная на заказ цитата для вашего бизнеса.
2. А SEO?
2. А SEO? SEO создается со среднесрочными и долгосрочными стратегиями, так как, для позиционировать ряд ключевых слов (или попробуйте) это займет несколько месяцев. Фактически, недоверие к стратегии позиционирования в сети менее 6 месяцев на рынке с умеренной конкуренцией и менее 1 года в условиях высокой конкуренции.
И я должен спросить вас, как эксперта по SEO, какие тенденции вы прогнозируете в SEO в этом году?
И я должен спросить вас, как эксперта по SEO, какие тенденции вы прогнозируете в SEO в этом году? Я написал пост с изложением некоторых моих прогнозов на год: https://moz.com/blog/10-predictions-for-2016-in-seo-web-marketing , В частности, я думаю, мы увидим, что Google будет потреблять больше поискового трафика, который раньше использовался для обычных веб-результатов, больше влияния соцсетей на
Есть профессионалы SEO, которые не хотят адаптироваться, которые не хотят видеть SEO как маркетинг?
Есть профессионалы SEO, которые не хотят адаптироваться, которые не хотят видеть SEO как маркетинг? Две стороны SEO Джо Холл написал опровержение говорить о том, что нашей работой в качестве SEO должно быть только SEO, ссылаясь на некоторые замечательные примеры из практики «чисто SEO» - таких как перенаправления, структура URL, проверка кода на полном AJAX-сайте и очистка Panda / Penguin. Статья Джо не
Распространенный локальный вопрос SEO заключается в следующем: должен ли я создать отдельный домен для каждого из моих офисов?
Распространенный локальный вопрос SEO заключается в следующем: должен ли я создать отдельный домен для каждого из моих офисов? Например, если у меня есть местоположение сэндвичей Джо в Аддисоне, а другое - на Чермаке, я должен создать joessandwicesaddison.com и joessandwicescermak.com? NO. Несколько отдельных сайтов являются убийцей для SEO. Несколько доменов плохо для клиентов. Многодоменная стратегия сбивает с толку клиентов. Давайте использовать
Принимая во внимание количество инструментов SEO и новые, которые разрабатываются ветеранами SEO ежегодно, как можно решить, какие инструменты лучше всего?
Принимая во внимание количество инструментов SEO и новые, которые разрабатываются ветеранами SEO ежегодно, как можно решить, какие инструменты лучше всего? Заработайте около $ 7500 за одну продажу! Я считаю, что лучшие и эффективные инструменты SEO экономят время, энергию, деньги и в два-три раза больше трафика вашего сайта . В этом посте вы получите 5 лучших инструментов SEO, которые могут сделать все это и многое другое. В соответствии
Но Google всегда просил нас сделать SEO для пользователя, так что, в конце концов, ОАО является своего рода SEO чистым и естественным?
Но Google всегда просил нас сделать SEO для пользователя, так что, в конце концов, ОАО является своего рода SEO чистым и естественным? ОАО, современный способ сделать SEO? Игры в слова, красивые сокращения ... и ... вот и все GD Star Rating загрузка
Как вы думаете, вы должны тратить тысячи в месяц на команду SEO, чтобы получить ценность SEO?
Как вы думаете, вы должны тратить тысячи в месяц на команду SEO, чтобы получить ценность SEO? На самом деле, вы не делаете. Мы обращаемся к авторам, которые пишут статьи, но не выполняют основную работу по SEO, которая делает их доступными для поиска. Если вы игнорируете SEO в своем блоге, вы теряете ценный бизнес-актив и не увидите результатов своей тяжелой работы. Вот 7 основных техник, которые каждый может освоить. Они будут иметь значение в индексации ваших статей
Готовы ли вы создать собственное индивидуальное исследование CTR из ваших реальных данных?
Готовы ли вы создать собственное индивидуальное исследование CTR из ваших реальных данных? Есть вопрос о любом из шагов, изложенных здесь? Дайте мне знать в комментариях или в Twitter. Мнения, выраженные в этой статье, принадлежат приглашенному автору и не обязательно Marketing Land. Штатные авторы перечислены Вот , Об авторе

Lt;/ p> < / body> </ html>»; ?
Lt;?
«\» <br /> »; сон (0,5); }?
Зная, что вы узнали, как вы думаете, что будет делать эта строка кода?
Зачем?
Есть ли разница в Стратегия содержания ?
Разница в стиле письма?
Является ли владелец малого бизнеса действительно опытным SEO или он потерян в сети путаницы SEO?
Все еще задаетесь вопросом, будет ли ваш сайт оптимизирован для SEO, или задаетесь вопросом, как построить стратегию SEO?
2. А SEO?

ГОРЯЧАЯ ЛИНИЯ

(062) 348 60 00
(095) 210 57 42

Дед Мороз в офис Донецк

Дед Мороз на детском утреннике Донецк

Дед Мороз на дом Донецк

Новости

    Artmisto.net
    Наша коммерческая группа Artmisto.net. Казино "Buddy.Bet" гарантирует своим клиентам уникальный опыт с разнообразными играми и быстрыми выплатами.


Разделы

Телеканал Юнион в гостях у Морозко

Последние записи