タグリムーバー

amazonの商品のリンクを貼るのに,amazletツールを使わせていただいております。ブックマークレットとかいうんでしょ。なんでもかんでもかわいい名前を付ければいいってもんじゃないとおもいますけどね。

いやいや非常に便利です。楽チンです。ずっと以前は,手作業でアマゾン・アソシエイトのページでシコシコとリンクを作成していたですよ。

しかしココログで使うには少〜し不満がありました。それは<div>タグです。こいつが悪さをするので,イメージリンクなどをそのまま貼り付けることができないのです。ここ最近まで手作業で取り除いていました。いい加減イヤになってきたので,ツールを書いています。秀丸のマクロでも充分できそうですが,
・任意のタグを削除する
というのはナニゲに流用できそうな匂いがする
ので,ちゃちゃっと3分間くっきんぐ・・・(そして3時間経過;;)・・・

そんなに世の中,甘くはないですなぁ。

まず,ガリガリと文字列処理ベースで書いてみましたが,<div> 〜〜〜 </div>だったり,<div 〜〜〜/>だったりするのでお手上げ。

次に,XMLパーサでごまかしたれ!というわけでごーりごーり。男は黙って,XmlTextReaderですよ・・・あぁ。結局,再帰に頼るのかヨ。

それでやっとなんとか動作するものができました。しかしまだネスティングを誤検出する問題が残っています。

ここまで作業してふと気づきました。とにかく目先の目的であるdivタグは,
 ・<div 〜〜〜>  〜他の要素やら値〜 </div>
という形式しかありません。ならば,ネスティングなぞ完全に無視して,
 ・<div 属性ずらずら >を削除
 ・問答無用で,</div>を削除
で攻めれば良かっただけちゃうのん?

はうっはうっ。おっしゃる通りでございまする〜 m(_,_)m

20050324233931

ここまで作ってみたけれど,ステですか?

続きはここ:タグリムーバー2で。

ごみためのランキングはこちら。