Получение значения spefic узла из шаблона html
-8
0
Я хочу получить все имена с моей html-страницы с шаблоном.
Смотри ниже:
<li >
<span class="industry-rank">1</span>
<span class="line">
<span class="info">
<a class="img-link" href="/nike/14e00e3f0bb79e4500c88440a6451b8f6cbaec5e">
<span class="img"
style="background-image: url(https://instagramimages-a.akamaihd.net/profiles/profile_13460080_75sq_1366391176.jpg)">
</span>
</a>
<span class="name">
<a href="/nike/14e00e3f0bb79e4500c88440a6451b8f6cbaec5e">Nike</a>
</span>
</span>
</span>
</li>
<li >
<span class="industry-rank">1</span>
<span class="line">
<span class="info">
<a class="img-link" href="/nike/14e00e3f0bb79e4500c88440a6451b8f6cbaec5e">
<span class="img"
style="background-image: url(https://instagramimages-a.akamaihd.net/profiles/profile_13460080_75sq_1366391176.jpg)">
</span>
</a>
<span class="name">
<a href="/nike/14e00e3f0bb79e4500c88440a6451b8f6cbaec5e">Roger</a>
</span>
</span>
</span>
</li>
HTML-страница имеет URL-адреса повторяющимся образом. Я хочу получить все имена только как "nike" или "roger".
Что мне делать, чтобы получить его?
Я попытался использовать curl для вызова url, но что мне делать после этого?
спросил(а)
2015-02-10T02:15:00+03:00
6 лет назад
добавить комментарий
пожаловаться
85
Вы правильно используете cURL. После того, как вы создадите запрос GET через URL-адрес, найдите библиотеку в Github, чтобы помочь с разбором HTML.
Вот ссылка на библиотеку, которая сделает все вышеперечисленное: https://github.com/mahadazad/page-scraper
ответил(а)
2015-02-10T02:21:00+03:00
6 лет назад
добавить комментарий
пожаловаться
Ваш ответ