Guardar una página web con C#

programación


Hola a todos, estoy intentando guardar el contenido de una url usando C#, o mejor explicado, intentando implementar la funcionalidad “Guardar como” de cualquier navegador, guardar la página web en un archivo html y una carpeta que contenga todos los archivos. e imágenes, o guardarlo en mht, ¿hay alguna manera de hacerlo usando .net framework, o alguna biblioteca o componente que me lo permita?, gracias…

Solución 1

¿Qué tal si googleamos primero?
Mira, lo que hay en la primera página: Convierta cualquier URL en un archivo MHTML utilizando código .NET nativo[^]

Solución 2

CodeProject es tu amigo: “Convierte cualquier URL en un archivo MHTML usando código .NET nativo” [^]. Este es un artículo antiguo (2005), basado en MHTBuilder de Google, pero es del propio Jeff Atwood, cofundador de StackOverFlow.

Más recientemente, existe el HTMLAgilityPack que muchas personas encontraron útil para sacar cualquier contenido de una página web; Hay una biblioteca de C#, actualizada en septiembre de 2014, en NuGet: [^].

Hay un artículo de CodeProject sobre el uso de HTMLAgilityPack con ASP.NET: [^].

Solución 3

usando System.IO;
usando Aspose.Html;

// Inicializa el documento HTML desde una URL para convertir una página web a HTML
usando var documento = nuevo HTMLDocument(“https://docs.aspose.com/html/net/message-handlers/”);

//Guardar página web
document.Save(Path.Combine(OutputDir, “root/result.html”));

コメント

タイトルとURLをコピーしました