Función para scraping con ASP clásico

Código ASP clásico

El término "web scraping" hace referencia a la técnica de extracción automática de datos de un sitio web. Los datos que se pueden extraer pueden incluir texto, imágenes, vídeos, precios y cualquier otra información que se encuentre en la página web. Los métodos más comunes utilizados en el web scraping son el análisis del código fuente HTML de la página y el uso de herramientas de software específicas para extraer los datos de manera estructurada.

Función para scrap con ASP clásico:


<%
    '*******************************************************************
    'Scrape a page's content into a string
    Public Function GetHttp(Byval Url)
        Dim objXml
        Set objXml = createobject("MSXML2.ServerXMLHTTP")
            objXml.open "GET", URL, false
            objXml.send()
            If Err <> 0 then
                GetHttp = "Error: " & err.description
            End If
            if len(objXml.ResponseText) > 0 then
                GetHttp = objXml.ResponseText
            else
                GetHttp = "There is no content."
            end if
        Set objXml = Nothing
    End Function
    '*******************************************************************
    'Get the content to display based on a regExp pattern
    Public Function GetContent(strContent, strPattern)
        Dim objRegExp, Matches
        Set objRegExp = New RegExp
        objRegExp.Pattern = strPattern
        objRegExp.IgnoreCase = True
        objRegExp.Global = True
        Set Matches = objRegExp.Execute(strContent)
            for each match in Matches
                GetContent = GetContent & match.Value
            next
        Set objRegExp = Nothing
    End Function
 
'example:
dim strURL : strURL = "http://sports.espn.go.com/nfl/news/story?id=3305060&campaign=rss&source=NFLHeadlines"
strFullContent = GetHttp(strURL)
response.write(GetContent(strFullContent,"<h2([\s\S]*?)end recap text --></div>"))
%>

Es todo

tags: web scraping, ASP clásico, extracción de datos, programación web, análisis de datos, automatización, SEO, marketing digital.

En esta sección encontrarás una mezcla de códigos recopilados de fuentes públicas de Internet y otros creados por CoreASP. Estos recursos se comparten de buena fe con el único objetivo de servir como base de conocimiento en el desarrollo de aplicaciones en ASP Clásico. CoreASP no garantiza la precisión, vigencia ni funcionamiento de los artículos o fragmentos de código publicados, y no se hace responsable por el uso que se les dé. Se recomienda siempre revisar, adaptar y probar el código antes de implementarlo en entornos de producción.