.
Solución al Ejercicio: Reemplazar Urls
📋 Copiar código
import re
def reemplazar_urls(texto):
"""
Reemplaza todas las URLs encontradas en un texto con "[URL]".
Args:
texto: La cadena de texto de entrada.
Returns:
Una nueva cadena con todas las URLs reemplazadas por "[URL]".
"""
patron_url = re.compile(r'https?://\S+|www\.\S+')
return re.sub(patron_url, '[URL]', texto)
# Ejemplos de uso
texto1 = "Visita mi sitio web en https://www.ejemplo.com."
resultado1 = reemplazar_urls(texto1)
print(f"'{texto1}' con URLs reemplazadas: '{resultado1}'")
texto2 = "También puedes ir a http://subdominio.ejemplo.org/pagina?id=123."
resultado2 = reemplazar_urls(texto2)
print(f"'{texto2}' con URLs reemplazadas: '{resultado2}'")
texto3 = "Mira este otro sitio: www.otroejemplo.net."
resultado3 = reemplazar_urls(texto3)
print(f"'{texto3}' con URLs reemplazadas: '{resultado3}'")
texto4 = "Texto sin URLs."
resultado4 = reemplazar_urls(texto4)
print(f"'{texto4}' con URLs reemplazadas: '{resultado4}'")
texto5 = "Una URL al principio: https://algo.com/."
resultado5 = reemplazar_urls(texto5)
print(f"'{texto5}' con URLs reemplazadas: '{resultado5}'")
texto6 = "Múltiples URLs: http://uno.es y www.dos.org/path#frag."
resultado6 = reemplazar_urls(texto6)
print(f"'{texto6}' con URLs reemplazadas: '{resultado6}'")
texto7 = ""
resultado7 = reemplazar_urls(texto7)
print(f"'' con URLs reemplazadas: '{resultado7}'")
Explicación del Código:
-
import re
:
- Importa el módulo
re
para
trabajar con expresiones regulares.
-
def reemplazar_urls(texto):
:
- Define una función llamada
reemplazar_urls
que toma una cadena de texto (texto
)
como entrada.
-
patron_url = re.compile(r'https?://\S+|www\.\S+')
:
- Compila una expresión regular para buscar
URLs:
https?://\S+
:
Coincide con "http://" o "https://" seguido de uno o más caracteres
que no sean espacios en blanco (\S+
).
|
: Es el operador OR.
www\.\S+
: Coincide
con "www." seguido de uno o más caracteres que no sean espacios en
blanco.
- Esta expresión regular intenta
cubrir tanto URLs que comienzan con "http(s)://" como aquellas que
comienzan con "www.".
-
return re.sub(patron_url,
'[URL]', texto)
:
- Utiliza la función
re.sub()
para buscar todas las coincidencias del patron_url
en el
texto
y reemplazarlas con la cadena "[URL]".
Ejemplos de Uso:
Los ejemplos muestran cómo la función reemplaza
diferentes tipos de URLs encontradas en el texto con el marcador "[URL]".