かきくけこうもりのよろず投資日記(旧サイト)

　

かきくけこうもりのよろず投資日記(旧サイト)

　

このサイトは移転しました。サイト右側のリンクから、新しいブログに移動できます。

　

2006年7月18日を表示

EfTidyというTidy Libraryのラッパーがあるらしい

	HTMLDocumentはWebBrowserオブジェクトを使わないと文字列を直接DOMで解析する方法が無い、というわけでゴリゴリと正規表現やら何やらを色々使って証券会社のページを解析することにしました。やってみるとかなり面倒。いきなり証券会社の注文ページを解釈するプログラムを書くのは気が引けたので、まずは信用取引規制銘柄や証券会社固有の規制がある銘柄が示されているテーブルを解釈するプログラムを書きました。でもこれだけでも結構面倒でした。発注に関しては予めどんな引数が必要なのかをHTMLソースを見て調べておけば、あとは引数をPOSTするだけでいいはずなので、むしろ楽なのかもしれません。ただPOSTの後で返ってきた内容を調べるのとか結構面倒くさそう。とはいえ、プログラムを書いていくうちに、他人の出所不明のHTMLパーサを使うよりは、自分で書いたHTMLパーサを使ったほうが安心な気がしてきました。多分その方が変なバグがあったときに悩まされずに済みます。でもやっぱり面倒。で、VB.NETにまともなHTMLパーサのライブラリが無いと嘆いていたのですが、色々探していたらEfTidy: The Tidy Library wrapper - The Code Project - C++ / MFCというのを見つけました。まだ使ってみてませんが、他のHTMLパーサよりも使い物になるかもしれません。 HTMLTidyというのはHTMLのエラーをチェックしたりHTMLをXHTML化したりしてくれる有名なツールです。HTML Tidy Project Pageでこのライブラリーが公開されていて、その中にはHTMLのパーサ機能が含まれています。もともとエラー付きの汚いHTMLを読み込むことを前提に設計されているものなので、多分汚いHTMLでもきちんとパーサとして機能してくれるのではないかと思います。EfTidyはそれのラッパーで、これを介してVB.NETから利用することができるようです。HTMLDocumentとは違ってちゃんとメモリ上にある文字列型のHTMLソースを読み込めるようになっているようです。これを使ってみようかな～とも思うのですが、そこまでする必要あるのかな～という思いもあって、ちょっと悩み中。そのうちXML化する可能性のあるものにおいて、現段階でわざわざそこまでしてHTMLを解析する必要があるのか？という疑問。まあ、もし正規表現で記述していくのもやってられないくらい面倒くさいHTMLパージング処理が必要になったら考えます。それにしても、新興は結構やばそうですね。　　　　　[ﾟдﾟ] 　　　　/[＿]ヽ　　　　　\|　\| 　■■□■■□◇＿◇□□□ 　　　　　[ﾟдﾟ] 　　　　□＿]ヽ□ 　　　　　\|　\| 　■■＿■■＿◇＿◇□□□ 　　　　　　　　　　[ﾟдﾟ] 　　　　　　　　　□＿]ヽ□ 　　　　　　　　　　\|　\| 　■■＿■■＿◇＿◇□□□ 　　　　　　　　　　　　　　　[ﾟд 　　　　　　　　　　　　　　□＿　　　　　　　　　　　　　　　\|　\| 　■■＿■■＿◇＿◇□□□ 　■■＿■■＿◇＿◇□□□

7月18日（火） \| トラックバック(0) \| コメント(0) \| 日記 \| 管理

(1/1ページ)

リンク

移転先

かきくけこうもりのよろず投資

リンク

kakikukeのサイト・資料集

肴菜や楓－noir－

Another 朝顔日記

鹿島台の内海工業

炎の作品 ― flamework_net ―

ぽっかぽかオレンジ

窓際オリガミストの日記

もりっと仙台森づくり

最近の記事

移転しました。
移転しました。
移転しました。
移転しました。
移転しました。
今日も勝てた＼(＾o＾)／
売り偏重で辛勝
自動売買アルゴリズムを変更してからはじめての利益
売りの損切りで曲げた
売買記録の個別銘柄の記録をやむを得ずやめました

2006年 7月

アーカイブ

|2006年12月 (4)
|2006年11月 (10)
|2006年10月 (26)
|2006年 9月 (22)
|2006年 8月 (23)
|2006年 7月 (26)
|2006年 6月 (29)
|2006年 5月 (25)
|2006年 4月 (26)
|2006年 3月 (25)
|2006年 2月 (23)
|2006年 1月 (45)

カテゴリー

～未分類～

売買記録 (146)
日記 (137)
プロフィール (3)
株式相場 (4)
証券CFD取引 (14)

新着コメント

かきくけこうもり 09/26（火）

アルゴリズム体操 09/26（火）

MR.X 09/01（金）

新着トラックバック

こんにゃろぉぉぉっ 12/09（木）

もう濡れてるよぉ。。。 11/27（土）

スイカップきたこれ 11/22（月）

バロスwwww 11/15（月）

ドドドドド 11/11（木）

うっひょぉぉぉ！！ 11/03（水）

びっくりしました 10/24（日）

どこで覚えたんだ！？ 10/17（日）

初体験なのにぃぃぃ！！ 10/07（木）

へっぽこなめ太郎 09/30（木）

携帯

ぶっとびねっとのブログは
携帯からもアクセスＯＫ！

QRコード

サイト情報

管理人：かきくけこうもり ◆JGCpIA5RMU (◆inBNdO7qnA)

訪問者数：103182
今日:9　昨日:44

フォトログ表示

アクセス解析

My BLOG