Mysql
 sql >> Base de Dados >  >> RDS >> Mysql

Salvar o URL da imagem da pesquisa do Google no MySQL


Eu sugiro que você use a Biblioteca DOM do PHP . É muito poderoso e permite analisar qualquer estrutura DOM. Consulte alguns de seus exemplos e você poderá implementá-lo facilmente.

A ideia é que você estude a estrutura HTML da página retornada pelo Google e, consequentemente, use a biblioteca DOM para analisar tags específicas. Pelo que vejo, as imagens estão organizadas como <ul> e <li> marcas, como:
<ul class="rg_ul" data-pg="1" data-cnt="6">
    <li class="rg_li" data-row="1" style="width:216px;height:162px"></li>
    <li class="rg_li" style="width:231px;height:162px"></li>
    <li class="rg_li" style="width:218px;height:162px"></li>
    <li class="rg_li" style="width:216px;height:162px"></li>
    <li class="rg_li" style="width:216px;height:162px"></li>
    <li class="rg_li" style="width:217px;height:162px"></li>
</ul>

Dentro de cada <li> tag existem tags adicionais, uma das quais é <a> . Esta tag parece ter 2 atributos - "imgrefurl" e "imgurl" - que podem fornecer a imagem que você precisa. Qual desses 2 atributos você precisa explorar.

Alternativamente, existe um <img> tag dentro de <li> que tem um atributo "src" contendo o binário da imagem real. Então você pode analisá-lo também. Observe que o binário é para a imagem que você vê na página de pesquisa e não para a imagem real.

Para alguns ponteiros para DOM, este método pode ser útil - http://www .php.net/manual/en/domelement.getelementsbytagname.php e http://www.php.net/manual/en/domelement. hasattribute.php - para ler todos os <li> tags e, em seguida, analise as que usam a classe "rg_li".

Espero que o acima faça sentido