最近、自習を兼ねて、バイナリ解析するアプリを書いていますが、言語が備えていると(私が)嬉しい3つの条件があります。
個別にみると珍しくない条件で、3つの条件を満たす言語もこの世に既にありそうですが、今のところ「コレだ!」というものが見つからず、気分がモヤモヤしています。
初めはCで書いていましたが、条件2と条件3がない辛さに耐えられなくなりました。リストや連想配列の再発明は、それはそれで楽しいけれど、やりたいこととは関係ないんです。
次はC++ with Boehm GCで書きましたが、条件3に躓いたときGTKにぶち当たって挫けました。決して悪いライブラリではないのですが…。
今はJavaで書いていて概ね良好ですが、条件1のunsigned型がないため細々した部分で面倒くさいです。
一番条件が合うのはVisual C# .NETでしょうか。条件3のLinuxサポートが微妙か?Monoの気分次第ですね。変わり種としてD言語も条件合いそうですが、使う気があまり起きません…なぜでしょう。
スクリプト言語の手軽さには心惹かれていて、ぜひ使いたいところですが、RubyやPythonはやはり条件1が満たせません。Javaと同様でunsignedがないのです。
ブラウザベースのJavaScriptや、ゲーム界で大人気のLuaも心惹かれていますが、どうも整数値という概念がなく、全て浮動小数点として扱われるようで、演算、特に除算とビットフィールドの扱いが面倒くさそうです。
時代の流れ的に整数型ってなくなる方向みたいですし、今後に期待しても望みは薄いかもしれません。うむむ…困ったね。
せっかく年休を取ったのに、雨、というか台風来てるし…。
前回(2013年6月13日の日記参照)こんなこといいな、できたらいいな、とウダウダ書きましたが、結局何がしたいのか?を考えてみました。
条件2(ガベージコレクション)と3(標準ライブラリ、GUIライブラリ)についてはalloc/freeは面倒くさい、車輪の再発明は面倒くさい、という普遍的な悩みですから特筆することはないでしょう。引っかかるのは条件1(unsigned型の存在)です。
条件1がなくて困るのは「バイト列のMSB側からNビット取ってきて、数値として返す」処理(※)が返すべき数値が、signedだったり、unsignedだったりして扱いが面倒くさいことです。
例を挙げると、あるバイト列から3ビット取ってきて3'b101というビット列が得られたとします。得られたビット列を5と解釈すべき場合と、符号拡張して -3と解釈すべき場合があるということです。
(※)MPEGの仕様書なんかでgetbits() という関数が出てきますが、まさにアレです。
単にNビット整数値の符号拡張をしたいだけであれば、下記のようにすればunsigned型なんて要りません。
/**
* Sign extension.
*
* @param v Value
* @param n Bits of v
* @param s 0: don't sign extension,
* otherwise: do sign extension
*/
long long signext(long long v, int n, int s) {
long long sb, mb;
if (n == 0) {
return 0;
}
sb = 1LL << (n - 1);
mb = (-1LL << (n - 1)) << 1;
v &= ~mb;
if (s && (v & sb)) {
v = mb + v;
}
return v;
}
さらに言えばRubyのように無限長整数を扱える言語の方がオーバーフローを考えなくて良いという点で有利である、とすら言えるでしょう。
あれだけ長々書いたくせに自己解決しちゃったよ、非常に迷惑だね!
でも、なんだろうこのコレジャナイ感は…?
< | 2013 | > | ||||
<< | < | 06 | > | >> | ||
日 | 月 | 火 | 水 | 木 | 金 | 土 |
- | - | - | - | - | - | 1 |
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | - | - | - | - | - | - |
合計:
本日: