6 usuarios conectados

Reemplazar Urls. Ejercicio en Python

Comparte esto

 
Escribe una función en Python llamada reemplazar_urls que tome una cadena de texto como entrada y devuelva una nueva cadena donde todas las URLs encontradas hayan sido reemplazadas por "[URL]".

.


Más ejercicios




Mostrar/Ocultar ejercicio resuelto


  Solución al Ejercicio: Reemplazar Urls

📋 Copiar código



import re

def reemplazar_urls(texto):
  """
  Reemplaza todas las URLs encontradas en un texto con "[URL]".

  Args:
    texto: La cadena de texto de entrada.

  Returns:
    Una nueva cadena con todas las URLs reemplazadas por "[URL]".
  """
  patron_url = re.compile(r'https?://\S+|www\.\S+')
  return re.sub(patron_url, '[URL]', texto)

# Ejemplos de uso
texto1 = "Visita mi sitio web en https://www.ejemplo.com."
resultado1 = reemplazar_urls(texto1)
print(f"'{texto1}' con URLs reemplazadas: '{resultado1}'")

texto2 = "También puedes ir a http://subdominio.ejemplo.org/pagina?id=123."
resultado2 = reemplazar_urls(texto2)
print(f"'{texto2}' con URLs reemplazadas: '{resultado2}'")

texto3 = "Mira este otro sitio: www.otroejemplo.net."
resultado3 = reemplazar_urls(texto3)
print(f"'{texto3}' con URLs reemplazadas: '{resultado3}'")

texto4 = "Texto sin URLs."
resultado4 = reemplazar_urls(texto4)
print(f"'{texto4}' con URLs reemplazadas: '{resultado4}'")

texto5 = "Una URL al principio: https://algo.com/."
resultado5 = reemplazar_urls(texto5)
print(f"'{texto5}' con URLs reemplazadas: '{resultado5}'")

texto6 = "Múltiples URLs: http://uno.es y www.dos.org/path#frag."
resultado6 = reemplazar_urls(texto6)
print(f"'{texto6}' con URLs reemplazadas: '{resultado6}'")

texto7 = ""
resultado7 = reemplazar_urls(texto7)
print(f"'' con URLs reemplazadas: '{resultado7}'")


Explicación del Código:

  1. import re:

    • Importa el módulo re para trabajar con expresiones regulares.
  2. def reemplazar_urls(texto)::

    • Define una función llamada reemplazar_urls que toma una cadena de texto (texto) como entrada.
  3. patron_url = re.compile(r'https?://\S+|www\.\S+'):

    • Compila una expresión regular para buscar URLs:
      • https?://\S+: Coincide con "http://" o "https://" seguido de uno o más caracteres que no sean espacios en blanco (\S+).
      • |: Es el operador OR.
      • www\.\S+: Coincide con "www." seguido de uno o más caracteres que no sean espacios en blanco.
      • Esta expresión regular intenta cubrir tanto URLs que comienzan con "http(s)://" como aquellas que comienzan con "www.".
  4. return re.sub(patron_url, '[URL]', texto):

    • Utiliza la función re.sub() para buscar todas las coincidencias del patron_url en el texto y reemplazarlas con la cadena "[URL]".

Ejemplos de Uso:

Los ejemplos muestran cómo la función reemplaza diferentes tipos de URLs encontradas en el texto con el marcador "[URL]".