本を読む

読書やコンピュータなどに関するメモ

「DRBD開発者Philipp Reisnerと語るゆうべ」に参加

 9月13日に、サードウェア社が中心になって開催された勉強会「DRBD開発者Philipp Reisnerと語るゆうべ」に参加してきました。

 DRBDというのは、Linuxのブロックデバイスのドライバーにはさまって、TCP/IPごしにミラーリングするソフトです。インフラ系でちょくちょく採用例を聞くようになってきているところに、作った人が中身の話をしてくれるということで、聞いてきました(遅刻しましたが)。MySQLがDRBDに対応していることもあってか、MySQLの中の人も何人か来ていました。

 質問歓迎ということで、パフォーマンスや障害時の挙動などに質問が集まりました。最近はディザスターリカバリー方面の機能強化がいろいろ着手されているようで、サードウェアでも検証のために回線遅延シミュレータを借りたりしているようです。

 懇親会でもそのまま質問が続き、ホワイトボードが図でいっぱいに。自分のまわりでも、「DRBDなデバイスからブートするのは可能か」「そりゃ無理」とか、「RAMディスクをDRBDでハードディスクにミラーする」というヨタとか、活発に議論がなされていました。ちなみに、最後には「Software Design」2009年6月号のサイン大会になりました。

 メモをとりながら聞いたので、とりあえずメモほぼそのまま載せておきます。支離滅裂ですが。英語も技術もよくわかってないので、間違いなどありましたらご指摘ください。自分がメタデータのあたりがよく理解できてないのが残念。

CacheとDisk Schedulerの間に入る

write-after-writeの依存関係
re-ordering
依存関係のある部分は順序にバリアを入れる
CPUのOut of order実行みたい

Q: すべてシリアライズしちゃう? 大量のDBアクセスとか。ネットがボトルネックになるのでは?
A: Yes、すべてシリアライズ。回線やNICの高速化(と"money")に期待

avoiding data diversion
通常、2つ以上の通信パスを持つ
コケた場合、リプリケーション先が古くなる
outdateマーク
bitmap
headtbeat / pacemaker
CRM constraintsベースの実装done

Q: リクエストを出したあとにコケたら?
A: つながったときに返事(?)。だから想定するとおりに動く

activityのロギング
クラッシュ後にフルに同期しなおすことはない
更新をためこむ
メタデータの更新は最小に
4MBのextent
同じ領域の書き直しをチェック(?)
LRUで置きかえ

Q: オーバーヘッドは
A: アプリによる。DBのロックなどは同じところを読み書き。アプリによってはランダム

Shared disk Semantics
どちらのノードも読み書きする場合
GFSなど
同時に同じブロックに書き込むと、たいていのファイルシステムではこわれる
Webに論文
考えられる組みあわせをsimulation

性能
GBe vs. 10GBe: Disk I/Oがボトルネック
シーケンシャルなアクセス: 3%落ち
bonnieベンチマークのアクセスパターン: 4%落ち

用途
DB: PostgreSQL、MySQL、Oracle
HA virtualization: Xen、KVM、VServer、OpenVZ/Virtuozzo
HA SAN: iSCSI
 複数のDCにあるiSCSIターゲットをインターネット経由でつなぐ
 それぞれのDCからはローカルなiSCSIターゲットにアクセス
HPCファイルサーバー: Lustre
Clustered Samba
Linuxアプリ

DRBD 8.3: Device stacking
DR用に第3のノードを接続できる
DC内は同期、DC間は非同期にできる
デイジーチェーン接続できる

1999スタート
AustriaのUniversity Vienna
8.2: online verify、end-to-end checksum
8.3: deice stacking、>4TB、checksum based resync (←DRBD+)

商用版
DRBD Proxy
でかいTCPバッファみたいなもの
非同期
4CPUサポート。もっと増やす

Roadmap
8.3: Compressed bitmap exchange、>16TB、Infiniband
9: もっとノード、フルにログ、モジュール化

Q: low latency
A: send more packets、big packets

Q: ファイルシステムのおすすめは
A: なんでも。ディストリビューションでサポートしてるものを。xfsはスケールするからいいんじゃないか(?)。raiserfsは使わないほうがいい(笑)細かいところを自分でいじっていて(?)エンタープライズ用途では使えない

Q: DRBD+の機能をマージした理由
A: ビジネスモデルの変更。サポートのほうで

Q: Infinibandはもう対応?
A: あと1-2か月
Q: モジュール化は
A: ロギングとか大変

Q: バージョン番号が0.8から8にひとけた飛んだけど(笑)
A: よくあること(笑)

コメント

コメントの投稿

管理者にだけ表示を許可する

トラックバック

http://emasaka.blog65.fc2.com/tb.php/637-9c113fac

 | HOME | 

Categories

Recent Entries

Recent Comments

Recent Trackbacks

Appendix

emasaka

emasaka

フリーター。
連絡先はこのへん

Monthly


FC2Ad