かきくけこうもりのよろず投資日記(旧サイト)

　

かきくけこうもりのよろず投資日記(旧サイト)

　

このサイトは移転しました。サイト右側のリンクから、新しいブログに移動できます。

　

ＡＩで楽曲を楽器やボーカルに分離する

2006年7月16日を表示

WebBrowserコントロール使わないとHTMLDocument使えない！

	HTTPRequestクラスとHTTPResponseクラスを使ってWEBサイトからHTMLを文字列形式で受信することはできたのですが、ここで問題発覚。HTMLの構造を解析するためにHTMLDocumentを使おうとしたら、このHTMLDocumentはWebBrowserコントロールと連携する形でしか使えないようです。つまり文字列を直接HTMLDocumentに変換して、HTMLDocumentのパーサを利用するというような方法が無いのです。XMLみたいにLoadXMLのようなメソッドがあればいいのですが、そういうものは存在しないようです。いくらなんでも、他にHTMLパーサみたいなクラスぐらいあるだろ～と思って調べても、見つかりませんでした＿\|￣\|○。そういうクラスが存在しないということを確認するのに丸一日かかっちゃったよ＿\|￣\|○＿\|￣\|○＿\|￣\|○ でも何でHTMLDocumentよりも単純なHTMLパーサが無いの？？？おかげで、自動売買をやってるブログで、axWebBrowserをスレッドではなくタイマーで制御していたり、わざわざ発注専用のアプリケーションを使って引数付きで起動して発注していたり、UWSCを使ってる理由がよくわかりました＿\|￣\|○。私の現在の実装では売買シグナルが出る度に発注を別スレッドでやる予定だったので、これは厳しいです。でもaxWebBrowserはコントロールだから、あまりマルチスレッドには向かない感じです（無理というわけではないけど、ちと実装面で不安な部分がある）。 HTMLDocumentを使わないで独自にパーサを作ってやるか、それともaxWebBrowserコントロールを使ってアクセスするか…… 色々考えたのですが、結局HTMLDocumentを使わない方向で実装することになりそうです。多分GMOインターネット証券がそのうち発表するであろうAPIはWebAPIでXMLを返してくる形式のものなのではないかと思うので（勘）、HTMLを文字列化したものをパーサに通すという形をとった方が後々楽なのではないかと。 HTMLパーサは誰か他の人が作ったライブラリでもあるだろうと思って色々調べてみたのですが、残念ながらどれも実装面がいまいちな感じでした。きちんとHTMLを解釈してくれないとか、読み込みの段階でエラーが出ちゃったりとか。 ETWrapperはどうやってるんだろうと思って調べてみたら、どうもRubyを使っているようです。私はRubyとか使ったことがないし、VB.NETとの連携の仕方もわからないので、これについてはお手上げです。自分でHTMLパーサを作るの、何か不安だなあ…… 　　　　　　　　∩∧＿∧ 　　　　　　l⌒) (´･ω･`)∩ 　　知らんがな!! 　　　　　　＼l⌒)　　　, ノ　　　　　　　　＼＿_ ノ　　　知らんがな！　　　知らんがな！　　∩∧__∧∩　　　∩∧∧∩　　　∧∧ 　　　(´･ω･`)/　　　\| (´･ω･`) / (´･ω･`) 　　ヽ(　･ω)ﾉ∩／■＼∩.∧___∧∩ 　　　(´･ω･`)l （　　　） l( ω･　`)/

7月16日（日） \| トラックバック(0) \| コメント(0) \| 日記 \| 管理

とりあえずWEBサイト読み込めるようになった

	とりあえずWEBサイトにアクセスするためのプログラムをちょっとだけ書きました。作ってる最中にVB.NETのオブジェクトの参照関係がおかしくなっちゃったみたいで、System.Web.HttpUtilityを呼び出そうとしても、そんなオブジェクトは存在しない～みたいなエラーが出てきました。どうしてだぁ～？と思って色々弄くっていたところ、オブジェクトブラウザの方で参照の更新をかけると正常な状態に戻りました。その後HttpWebRequestとかを弄っていたのですが、こういうのを組むのは久しぶりのことなのでてんてこ舞い。エンコードとか引数の渡し方とかをすっかり忘れてしまっています。そこでまずは難しいことを考えずに、POSTやGETを使ってサイト上の文字列を取得するプログラムを書くことを目的としました。最初はGoogleを使ってテストしていたのですが、GoogleだとPOSTメソッドを受け入れてくれないようなので、POSTメソッドに関してはlivedoorファイナンスのカブログの検索ページでテストしました。カブログのページはGETメソッドで応答するように作られていますが、POSTメソッドも受け入れるようです（というか、大抵のGETメソッドを受け入れるページはPOSTメソッドも同じ引数で受け入れるようにできているのですが）。私が使っているNorton Internet Securityのログを見てみると、一応見た目には引数が無い状態でカブログにアクセスしていて、実際には検索結果が得られているので、多分POSTはうまくいっていると判断。あとは証券会社に実際にユーザーIDとパスワードをぶち込んで送信すればログインできるはずですが、ちょっと怖いのでまだやってません。結局まだPOSTメソッドやGETメソッドで取得したものを文字列として返すだけという状態ですが、まあWEBサイトへのアクセスの肝となる部分は何とかなったと思います。とりあえず、GMOインターネット証券がAPIを公開するまでは、HTMLをゴリゴリと読み込んで、目的の値が記述されているところをタグの深さから類推するような形になりそうです。現物買い付け余力を囲むtdタグとかにクラス属性とかが設定されていれば読みやすいんだけどなあ。これが嫌だからAPIに期待。　　＿＿＿＿_＿　 \|┌‐――┐\|　\|-、　 \| \| 　　　　\| \|　\|　] 　　ｻﾞｰ …… 　 \| \|_/￣￣ \|\| \|　\|_/ 　└ \|　　　　\|┘-'､　／lll\|\|\|\|\|\|\|lll ＼\|　 \|\| m　ﾉlll\|\|\|\|\|lll`mﾉ\|＿\|\|

7月16日（日） \| トラックバック(0) \| コメント(0) \| 日記 \| 管理

(1/1ページ)

リンク

移転先

かきくけこうもりのよろず投資

リンク

kakikukeのサイト・資料集

肴菜や楓－noir－

Another 朝顔日記

鹿島台の内海工業

炎の作品 ― flamework_net ―

ぽっかぽかオレンジ

窓際オリガミストの日記

もりっと仙台森づくり

最近の記事

移転しました。
移転しました。
移転しました。
移転しました。
移転しました。
今日も勝てた＼(＾o＾)／
売り偏重で辛勝
自動売買アルゴリズムを変更してからはじめての利益
売りの損切りで曲げた
売買記録の個別銘柄の記録をやむを得ずやめました

2006年 7月

アーカイブ

|2006年12月 (4)
|2006年11月 (10)
|2006年10月 (26)
|2006年 9月 (22)
|2006年 8月 (23)
|2006年 7月 (26)
|2006年 6月 (29)
|2006年 5月 (25)
|2006年 4月 (26)
|2006年 3月 (25)
|2006年 2月 (23)
|2006年 1月 (45)

カテゴリー

～未分類～

売買記録 (146)
日記 (137)
プロフィール (3)
株式相場 (4)
証券CFD取引 (14)

新着コメント

かきくけこうもり 09/26（火）

アルゴリズム体操 09/26（火）

MR.X 09/01（金）

新着トラックバック

こんにゃろぉぉぉっ 12/09（木）

もう濡れてるよぉ。。。 11/27（土）

スイカップきたこれ 11/22（月）

バロスwwww 11/15（月）

ドドドドド 11/11（木）

うっひょぉぉぉ！！ 11/03（水）

びっくりしました 10/24（日）

どこで覚えたんだ！？ 10/17（日）

初体験なのにぃぃぃ！！ 10/07（木）

へっぽこなめ太郎 09/30（木）

携帯

ぶっとびねっとのブログは
携帯からもアクセスＯＫ！

QRコード

サイト情報

管理人：かきくけこうもり ◆JGCpIA5RMU (◆inBNdO7qnA)

訪問者数：131490
今日:23　昨日:45

フォトログ表示

アクセス解析

My BLOG