Función para scraping con ASP clásico

Código ASP clásico

El término "web scraping" hace referencia a la técnica de extracción automática de datos de un sitio web. Los datos que se pueden extraer pueden incluir texto, imágenes, vídeos, precios y cualquier otra información que se encuentre en la página web. Los métodos más comunes utilizados en el web scraping son el análisis del código fuente HTML de la página y el uso de herramientas de software específicas para extraer los datos de manera estructurada.

Función para scrap con ASP clásico:


<%
    '*******************************************************************
    'Scrape a page's content into a string
    Public Function GetHttp(Byval Url)
        Dim objXml
        Set objXml = createobject("MSXML2.ServerXMLHTTP")
            objXml.open "GET", URL, false
            objXml.send()
            If Err <> 0 then
                GetHttp = "Error: " & err.description
            End If
            if len(objXml.ResponseText) > 0 then
                GetHttp = objXml.ResponseText
            else
                GetHttp = "There is no content."
            end if
        Set objXml = Nothing
    End Function
    '*******************************************************************
    'Get the content to display based on a regExp pattern
    Public Function GetContent(strContent, strPattern)
        Dim objRegExp, Matches
        Set objRegExp = New RegExp
        objRegExp.Pattern = strPattern
        objRegExp.IgnoreCase = True
        objRegExp.Global = True
        Set Matches = objRegExp.Execute(strContent)
            for each match in Matches
                GetContent = GetContent & match.Value
            next
        Set objRegExp = Nothing
    End Function
 
'example:
dim strURL : strURL = "http://sports.espn.go.com/nfl/news/story?id=3305060&campaign=rss&source=NFLHeadlines"
strFullContent = GetHttp(strURL)
response.write(GetContent(strFullContent,"<h2([\s\S]*?)end recap text --></div>"))
%>

Es todo

tags: web scraping, ASP clásico, extracción de datos, programación web, análisis de datos, automatización, SEO, marketing digital.

En esta sección encontrarás una mezcla de códigos recopilados de fuentes públicas de Internet y otros creados por ASP TEAM. Compartimos recursos útiles de buena fe para formar una base de conocimiento en el desarrollo de aplicaciones en ASP Clásico.