Cómo hacer Strip HTML en ASP clásico

Código ASP clásico

Strip HTML es un término utilizado en programación y desarrollo web para referirse al proceso de eliminar todas las etiquetas HTML de un texto o cadena de caracteres. Esto es útil en muchas situaciones, como cuando se necesita procesar el contenido de una página web para su posterior análisis o almacenamiento.

Cuando se visualiza una página web en un navegador, se muestra una página web con un formato y diseño atractivo, con texto, imágenes y otros elementos que se organizan mediante etiquetas HTML. Sin embargo, a menudo es necesario extraer solo el contenido de texto de una página web para su posterior análisis o almacenamiento. En este caso, se utiliza una técnica de strip HTML para eliminar todas las etiquetas HTML y dejar solo el contenido de texto plano.

Strip HTML se realiza utilizando diferentes técnicas y herramientas, que pueden incluir la programación de scripts personalizados o el uso de bibliotecas y módulos específicos que están diseñados para esta tarea. Estas herramientas pueden automatizar el proceso de eliminación de etiquetas HTML y permiten que los desarrolladores procesen grandes cantidades de contenido de manera eficiente y precisa.

Código ASP clásico para strip HTML


<%
FUNCTION stripHTML(strHTML)
  Dim objRegExp, strOutput, tempStr
  Set objRegExp = New Regexp
  objRegExp.IgnoreCase = True
  objRegExp.Global = True
  objRegExp.Pattern = "<(.|n)+?>"
  'Replace all HTML tag matches with the empty string
  strOutput = objRegExp.Replace(strHTML, "")
  'Replace all < and > with < and >
  strOutput = Replace(strOutput, "<", "<")
  strOutput = Replace(strOutput, ">", ">")
  stripHTML = strOutput    'Return the value of strOutput
  Set objRegExp = Nothing
END FUNCTION
%>


La función "stripHTML" es una función de Visual Basic Script (VBScript) que se utiliza para eliminar las etiquetas HTML de una cadena de texto. Esta función utiliza la biblioteca "Regexp" para buscar y reemplazar todas las etiquetas HTML en una cadena de texto.

El proceso que sigue esta función es el siguiente:

- Crea un objeto RegExp y establece las propiedades "IgnoreCase" y "Global" en "True".

- Establece el patrón de búsqueda como "<(.|n)+?>" para buscar cualquier cadena de texto que comience con "<" y termine con ">" (incluyendo cualquier contenido dentro de las etiquetas).

- Utiliza el método "Replace" del objeto RegExp para reemplazar todas las coincidencias de la expresión regular con una cadena vacía (es decir, eliminar todas las etiquetas HTML).

- Utiliza la función "Replace" para reemplazar los caracteres "<" y ">" con sus equivalentes "<" y ">" respectivamente.

- Devuelve la cadena resultante.

tags: strip html, ASP clásico, limpiar HTML, eliminar etiquetas HTML, filtrar HTML, expresiones regulares en ASP, funciones ASP, codigo asp clasico, funcion asp clasico

En esta sección encontrarás una mezcla de códigos recopilados de fuentes públicas de Internet y otros creados por ASP TEAM. Compartimos recursos útiles de buena fe para formar una base de conocimiento en el desarrollo de aplicaciones en ASP Clásico.