HTML内からリンクされている画像一覧の取得と表示

URLを入力すると、URLで示されるHTMLを取得し、その中のimgタグとリンクタグ(リンク先が画像のときのみ)の画像をダウンロードし、一覧として表示できる機能を実装した。利用したライブラリは、HTML Paser(http://htmlparser.sourceforge.net/)。まだ、マルチスレッド系のバグが潰せてないけど、一応、なんとなくの動作はしている。
これに伴って、ダウンロードした画像を一時的に保存するキャッシュ機構も導入して、一度ダウンロードした画像は、2度ダウンロードしないようにした。本当は、HTTPのステータスコードを見て、再ダウンロードか否かを判断しなきゃいけないけど、まだその辺のハンドリングは作りこんでなくて、単純にURLのパスのみでダウンロード済みか否かを判断している。
現状は、静的に作られたページのみちゃんと扱える。画像のURLが動的に生成されているような場合や、javascriptを使われていたりすると、動かない。