【解決方法】RSS フィードの URL またはその他の方法を使用してタイトル コンテンツなどを取得する場合など、任意の Web サイトからコメントを取得する方法

プログラミングQA


ほとんどのサイトにはコメント用のテキストボックスがあり、ビデオを見ているときに時々ページの下にコメントを入れて、他の人のコメントを見ることができます.他のコメントに基づくコメント。

だから私がやろうとしているのは、その特定のサイトの RSS FEED URL を指定して、それらのコメントを取得することです。 または、私の目標を達成するのに役立つその他の方法。

私が試したこと:

Java
import java.io.IOException;
import java.net.HttpURLConnection;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.Iterator;

import com.sun.syndication.feed.synd.SyndEntry;
import com.sun.syndication.feed.synd.SyndFeed;
import com.sun.syndication.io.FeedException;
import com.sun.syndication.io.SyndFeedInput;
import com.sun.syndication.io.XmlReader;

public class mainclass{
	
	@SuppressWarnings({ "rawtypes" })
	public static void main(String [] args){
		
	try{
		
		URL url = new URL("http://mybroadband.co.za/news/tag/mtn/feed");
		HttpURLConnection httpURLConnection = (HttpURLConnection)url.openConnection();
		
		
		httpURLConnection.setRequestProperty("User-Agent", "Mozilla/5.0");
		
		
		SyndFeedInput input = new SyndFeedInput();
		SyndFeed feed = null;
	try {
		feed = input.build(new XmlReader(httpURLConnection));
	} catch (IllegalArgumentException | FeedException e) {
		// TODO Auto-generated catch block
		e.printStackTrace();
	}
    	//List entries =(List) feed.getEntries();
    	Iterator itEntries = feed.getEntries().iterator();
    
 while(itEntries.hasNext()){
	 	SyndEntry entry = (SyndEntry)itEntries.next();	

	 	//System.out.print(entry.getTitle()+"\n");
	 	//System.out.println("Description");
	 	System.out.print("TITLE: "+entry.getTitle() +"\n");
	 	System.out.print("Discription:");
	 	System.out.print(entry.getDescription() +"\n");
 
    }
    
	}
	catch(MalformedURLException e){		
		e.printStackTrace();		
	}
    catch(IOException e){		
		e.printStackTrace();				
	}
	
	}
}

解決策 3

次の正規表現パターンを使用します。

"\<wfw\:commentRss\>(.*)\<\/wfw\:commentRss\>"

コメント

タイトルとURLをコピーしました