1400字制限

最近の記事のほとんどが1400字を超えているのでタイトル無視も甚だしいが1400字「以下」に制限するとは言っていない

大長編ドラえもん「のび太とアニマル惑星」を読む

藤子・F・不二雄作品の Kindle 化が進んでおり、長く絶版状態にあった「オバケのQ太郎」も気軽に読めるようになったのでファンとしては嬉しい限り。というわけで今回は「大長編ドラえもん」から「のび太とアニマル惑星」を紹介したい。(激しいネタバレあり)

この作品の舞台は動物たちが平和に暮らす「アニマル惑星」である。動物の世界が舞台という点では第3作「大魔境」と共通しているが、さすがにアフリカが人外魔境という設定はもう無理と思ったのか、アニマル惑星は地球から遠く離れた星系にある。また犬だけで成り立つ「大魔境」と違ってこちらは多種多様な動物(魚類も含む)が平和に共存している。戦争がないので軍隊もなく、治安もたいへん良いらしく警官は町にひとりだけ。政情不安定や地上げ屋に慢性的に悩まされる大長編世界で、アニマル惑星は際立って理想郷として描かれている。

F先生の大人向けSF短編であれば「肉食動物が草食動物を食べて生態系が成り立つ」とかいう描写を普通に入れそうな気がするが、本作は「ドラえもん」であるため、食糧供給は光合成技術により成り立ち、エネルギー供給はドラえもんをして「こんな効率のいいものは二十二世紀にもない」と言わしめる太陽電池によって成立している。理想郷は自然への回帰ではなく高度な科学技術による、という思想がかいま見える気もする。

f:id:yubais:20160115120118p:plain

この世界には建国神話として「月に住んでいた先祖が、神様の手によってニムゲという悪魔を逃れてこの星に来た」というものがある。このニムゲというのは人間のことであり、アニマル惑星は環境破壊や核戦争によって文明崩壊した人間の星との連星系になっていたのだ。

f:id:yubais:20160115121038p:plain

のび太たちはアニマル惑星を、前半はのび太の家に偶然現れた「ピンクのもや」で、後半は宇宙救命ボートで行き来することになる。その途中で地球の環境破壊の現状が紹介される。解説役はのび太のママ。大長編では珍しくちゃんとした役割がある。

f:id:yubais:20160115121425p:plain

こんな具合で「のび太とアニマル惑星」は「現状のままでは地球が文明崩壊してニムゲの星のようになってしまう」というわかりやすい寓話として構成されている。寓話要素の高めなドラえもんの中でも、この話はとくに直接的な構成になっている。悪く言えば説教臭い話である。

実際のところ、F先生は文明崩壊について相当な危機感を持っていたように思う。環境破壊や核戦争で人類滅亡というのはSF短編で繰り返し提示されるパターンだ。「のび太と雲の王国」「海底鬼岩城」でも、人間(地上人)は地球を汚す存在として描かれている。

このタイプの寓話はさすがにドラえもん時代に「やりつくされた」と感じたのか、90年代以降は岩明均の「寄生獣」に代表されるように、むしろ人間の立場を相対化した作品が人気を博すようになる。ソ連崩壊で全面核戦争のリアリティも失われ、ノストラダムスに予言された滅亡の99年を過ぎると、ニムゲの星のような終末論的世界観はSF世界の王道から忘れ去られつつあるように思う。ここらでひとつ「ドラえもん」を読み返して、この時代に提起された問題にあらためて思いを馳せてみたい。

アボガドロ数とアボカドの数はどっちが多いか

アボカドの出荷量は年間400万トン程度。1個300グラムとして100億個程度なので、成熟前のものや出荷されないものを含めても10^11程度だろう。アボガドロ数は 6x10^23 なので12桁違う。桁違いの桁が違う。

「化学のモルが分からなくて理系を諦めた」という人をよく見る。モルは原子の数を扱う単位で、鉛筆をダース(12個)単位で数えるのと同じようなものである。「なんでそれが分からんのかが分からん」と僕は思うが、なにしろ数がべらぼうに大きい(60,000,000,000,000,000,000,000個 = アボガドロ数)せいで人間の思考能力を破壊するのかもしれぬ。そこでアボガドロ数を色々なものと比較してスケール感を掴もうと思う。

地球をアボガドロ数個に分ける

地球を巨大なヨーカンだと思い*1アボガドロ数のブロックに分割すると、1個大体1.7リットルになる。2リットルペットボトルにヨーカンを詰め込んで、アボガドロ数だけ宇宙に放り投げて重力で寄せ集まる様を想像して欲しい。それが地球である。

地球そのものをアボガドロ数分割してもわりと身近なサイズなので、地球上に存在する身近なものをアボガドロ数用意するのはかなり難しいものが分かる。

砂粒とアボガドロ数

サハラ砂漠で概算する。面積は1000万km2。厚さについては色々な数え方があるが、ここでは少なめに100mとしよう。すると体積は10^15m3程度。砂の定義は「粒径2mm〜1/16mm」らしいので占有する体積は0.1mm3程度とする。この時点で10^25個でアボガドロ数を超える。地球全体の砂ともなればさらに1〜2桁多いだろう。

トランジスタアボガドロ数

2015年時点でのトランジスタ数は1.2x10^21個くらい*2らしい。つまり現時点でアボガドロ数に500倍足りない。インテルによると5年で15倍になってるらしいので、このペースで行くと2027年にトランジスタ数がアボガドロ数に達する。ムーアの法則破綻説が頻繁に言われるのでそう順調に増えるかどうかは知らんが。

ヒト細胞とアボガドロ数

ヒト細胞はよく60兆個と言われるが、最近の研究*3では37兆程度程度らしい。人類は70億人いるので、ヒト細胞の総数は2.6x10^23個程度でアボガドロ数の半分弱。160億人いれば足りるが、国連の予測では2100年の地球人口が110億とあるのでだいぶ先になりそうだ。

まとめ

砂とかトランジスタとか細胞とかいったミクロなものを、地球全体とか人類全体とかいうスケールで合計すればわりとアボガドロ数に近い。ただしアボカドの数では足りない。とても足りない。なお僕はアボカドをスライスして醤油をつけて食べるのが好きだ。

Wikipedia から「き」で終わる項目を抽出してラッキーマン登場botを作った

ガモウひろしの「ラッキーマン」をご存じだろうか。知らない人はいないだろうから説明はしない。というわけで先日、ラッキーマン登場時の決め台詞「ラッキー クッキー ○○キー」を大量生成するbotを作った。

必要なのは「き」で終わる単語を大量に集めることである。辞書としては Wikipedia を使うといいだろう。Wikipedia はクローリング行為を禁止しているが、代わりにデータのアーカイブが公開されている。日本語版 Wikipedia の最新版のダウンロードはこちら。

Index of /jawiki/latest/

いろんなのがあるけど、今回は項目名が各行にズラズラ書いてあるのが欲しい。 jawiki-latest-all-titles-in-ns0 というのがそれに該当した。157万9808項目あった。

次に「き」で終わる項目だけを抽出する。ひらがなとカタカナについては簡単だ。

$ grep -E "き$\|キ" input.dat

漢字については mecab という形態素分析ツールを使うと良いらしい。

$ sudo apt-get install mecab libmecab-dev mecab-ipadic-utf8 mecab-jumandic-utf8
$ echo 八代亜紀 | mecab
八代 名詞,固有名詞,人名,姓,*,*,八代,ヤシロ,ヤシロ
亜紀 名詞,固有名詞,人名,名,*,*,亜紀,アキ,アキ
EOS

これで下から2行目を見て「き」「キ」で終わってるものを取り出す。

この時点で49,230件。うち3割強の18,545件が「○○駅」だった。このままではラッキーマンが我らが鉄オタみたいになってしまうのでジャンプヒーローのイメージ保護の観点から削除した。

あとは「一字金輪仏頂」のように辞書に載ってない単語だと「頂」を「いただき」と読んでしまってるので、そういうのを grep で見つけて除去。「張敷」など中国人の人名をやたら訓読みするので除去。

この他「キー」「キイ」「key」などは適宜追加し、最終的に31364項目。原作によるとラッキーマンは777個のキーワードから自動的に選択しているとあるが、このbotは候補数において40倍。

ちなみに31364項目のうち最も長いのは「神学校および聖職への受けいれにおける、同性愛傾向を有する人物の召命を吟味するための基準に関する手引き」だった。

DNAはなぜ二重らせんなのか

20世紀の三大発見とは「アインシュタイン相対性理論、フレミングの抗生物質、ワトソン&クリックのDNA二重らせん構造解明」といわれる。

なるほどアインシュタインは空間・時間の概念を根本的に変えたし、フレミングは長年人類の敵であった感染症を激減させたわけだが、これと並べると「DNAの構造を解明した」というのは異様に地味に見える。そもそも「遺伝子はDNAという物質で出来ている」というのはそれ以前に知られており、ワトソン&クリックはDNA分子の具体的な構造を明らかにしただけである。

なぜ二重らせんという「構造の発見」が偉大なのか。それは、その構造がまさに「なぜ親は子に似るのか」という遺伝現象の根本的な疑問が、構造を見れば分かるというレベルで明確に説明されていたからだ。

そもそも普通の物質は「複製」なんてしない。大気中のCO2がどんどん増えてるのはCO2がCO2を複製してるからではなく、人間がガンガン燃料を燃やしているからである。ハードディスクの複製が可能なのは、コンピュータがいったんメモリ上の電子データに置き換えて再度書き込んでいるからだ。

そんな中で生命体だけ、物質 to 物質での複製という珍妙な現象が起きる。だから昔の人は「生命は無生物と違う不思議な力で駆動している」と考えていた。シュレディンガーは自著「生命とはなにか」において遺伝子に対し「非周期性の固体」という曖昧なイメージを与えている。

そのような生命の複製現象に対し、はじめて物質レベルでの説明を与えたのがかの「二重らせん構造」だ。DNAを構成するのは4種類の「文字」であり、A,T,G,C と呼ばれるが、この二重らせんのAの反対側にはかならずTが結合し、Gの反対側にはかならずCが結合するようになっている。この構造がわかれば「どうやって複製するのか」はすぐに分かるだろう。

f:id:yubais:20151008133450p:plain

KaiserScience, DNA replication より

二本鎖のDNAがからみ合っている。これがほどけると、片方がそれぞれもう片方の鋳型になっている。細胞内にばらばらに存在するATGCが集まってきて鋳型に貼り付く。こうしてDNAはその構造を保ったまま、2倍に複製される。これが物質 to 物質の自己複製の正体である。後の数十年でより詳細な複製機構が明らかになったが、基本はこのアイデアのとおりである。

ワトソンの自著によると、彼は当初はDNAの構造の解明と複製メカニズムの解明は別問題だと思っていたようだ。だが「A-T と G-C がペアになって並ぶ二重らせん」という構造に至ると、それ自体が複製方法について雄弁に語っていることが分かった。DNAが構造生物学の金字塔と呼ばれる所以である。*1

なおDNAに非常によく似た分子としてRNAがある。が、こちらは二重らせんではなく、通常は一本鎖として存在する。これはRNAの機能が複製ではなく、DNAの情報を読み取って他の分子に渡したり、それ自体が実働する分子だからだ。

 

*1:世の中には構造生物学をバカにする連中がいて、彼らは「生命分子の細かい構造なんて知っても仕方ない、そんなことでは全体論として "生命とは何か" という疑問に迫れない」としたり顔で語るが、彼らには二重らせん構造を投げつける必要がある。

Twitter で各言語の文字数分布を調べる

ということを「関係筋」が伝えているらしい。

たぶん日本語で Twitter をやってると、140字が「少ない」と感じることはほとんど無い。よほど余計な修飾語をつけない限り、140字あれば「序論・本論・結論」仕立ての文章を仕上げることが出来る。こんな具合に。

しかし考えてみれば、これは漢字文化圏であるために140字に詰め込める情報量が極端に多いせいである。英語などのアルファベット圏ではかなり文字数がカツカツなはずだ。そこで今回は、各言語ごとに文字数の分布を調べてみた。

調査の対象は、2013年時点で Twitter のシェア上位の10言語である。

Twitterの使用言語ランキング─1位英語、2位日本語、3位スペイン語 | リンゲルブルーメン

英語、日本語、スペイン語、マレー語、ポルトガル語アラビア語、フランス語、トルコ語タイ語、韓国語の順。ただしマレー語の検索フィルタが無かったのでインドネシア語と解釈した。

技術的なことはあとで Qiita あたりに書くつもりだが、要するに Public Streaming API というのを使えば特定の言語のツイートだけをどんどん拾うことが出来る。これで各言語について1000件のツイートを取得し、その文字数分布を調べた。

Public streams | Twitter Developers

なお、URL と画像の扱いであるが、URL は Twitter 側で圧縮されるためどんな長さでも全て23文字として扱われる。画像は4枚まで貼れるが、何枚あっても23文字のURLが1個追加される。

まずは Twitter の祖国である英語と、我らが日本語を比べてみよう。

f:id:yubais:20151001225149p:plain

f:id:yubais:20151001225228p:plain

あからさまに違いが出た。日本語は中間値 (median) が35文字で、まあ100文字もあればほぼ十分という雰囲気になってるのに対し、英語は中間値が72文字と倍以上あり、多くのツイートが字数制限に貼りつくように書かれているのが分かる。

ちなみに54文字に突出したピークがあるのは謎の時報botが大量に動いているせいである。他の言語にもこういうのがあって検索を妨害するのだが、まあグラフを見ればおおまかな傾向はわかるので今回は無視した。

以下、順番に見ていこう。

f:id:yubais:20151001225744p:plain

 

f:id:yubais:20151001230010p:plain

f:id:yubais:20151001230034p:plain

 

 

f:id:yubais:20151001230050p:plain

f:id:yubais:20151001230125p:plain

f:id:yubais:20151001230205p:plain

f:id:yubais:20151001230239p:plain

f:id:yubais:20151001230259p:plain

中間値30程度であからさまに文字数が余ってるグループ(日本語、タイ語、韓国語)と、中間値80近くで不満そうなグループ(その他)に分かれた。このへんは文字の特性によるんだと思うけど、タイ文字やアラビア文字の性質をよく知らないので言及を控えたい。いずれにせよ、多くの言語が140字という制限に不満を感じていそうだということは伝わってくる。

各言語で実際にどのようなツイートが行われているかは、グラフに書かれている2文字略号を Twitter の検索欄に lang:th のように入力してやれば見られる。例えばタイ語はこんな感じ。

lang:th - Twitter Search

 

四国が500km南に移動すると歴史はどう変わるか(ただの妄想)

f:id:yubais:20150930165433j:plain

もし日本列島が最初からこんな形だったら、どういう歴史が営まれていただろうかを考えてみる。

まず、こんな遠い四国に人が住んでるのか、と言われれば、太平洋諸島の隅々まで人が住んでるわけだから当然住んでいるだろう。では、その人種はどういう構成か。

日本人のルーツとは、氷河期にわたってきた縄文人と、2000年くらい前に来た弥生人が適当に混ざり合って出来たものだと大雑把に説明されている。ただしこの混合が十分でないため、南九州や東北ではより縄文系の遺伝子が強く残ってるらしい。となれば、四国人はおそらく南九州から渡来してくるだろうから、弥生系とほとんど混血せずに縄文系の強い遺伝子が残っていることだろう。彫りの深い顔は「四国顔」と言われるに違いない

こうも遠ければ、沖縄や北海道と同様に、おそらく明治になるまで朝廷や幕府の支配下に入ることは無い。それどころか、四国内で統一国家ができるかどうかさえ危うい。琉球でさえ15世紀にようやく尚巴志に統一されたし、ハワイが統一されたのはヨーロッパ人の到来後である。

琉球のように中継貿易で栄えるには位置的に難しそうだ。一方で面積があるので、農業で自足していくだろう。気候的には熱帯に近いだろうから「高松バナナ」とか「松本松山マンゴー」とか名産になってると思う。

むしろ、明治にきちんと日本に組み込まれるのかが不安になる。大航海時代にやってきたヨーロッパ人によりあっさり植民地化されて、現代ではグアムのようにアメリカ合衆国シコク準州なっている懸念もある。

一方で、影響を受けるのは四国だけではない。四国は世界で48番目に大きな島であり、台湾の半分ほどある。これだけの領土が日本列島から分離すれば、その日本史への、あるいは世界史への影響も相当なものがあるはずだ。

ジャレド・ダイヤモンド「銃・病原菌・鉄」によると、大航海時代を経て世界の覇権を制したヨーロッパと植民地化される中国の明暗は「地形」で説明できるという。いわく、ヨーロッパは半島や離島が多く統一国家が長く存在しなかったため、多数の国家が争い、一方のアジアは少数の勢力に統一されていた。この競争の有無が、最終的な世界の覇権を分けたのだという。

銃・病原菌・鉄 上巻
銃・病原菌・鉄 上巻
posted with amazlet at 15.09.30
草思社 (2013-07-12)
売り上げランキング: 859

ここで四国が遠く離れた独立勢力として存在していれば、大航海時代のヨーロッパに近い競争状態をつくり、東アジアが先に世界を席巻していたかもしれない。そうなれば今ごろ、アメリカ西海岸には漢字の看板がひしめくブレードランナー的、あるいはベイマックス的世界になっていたに違いない。四国、ちょっと近すぎたかも。

 

四国はどこまで入れ換え可能か (新潮文庫)
佐藤 雅彦
新潮社
売り上げランキング: 66,500

電気で生きる細菌のこと

電気で生きる微生物を初めて特定 | 理化学研究所

海底に生息する生物の一部は光と化学物質に代わる第3のエネルギーとして電気を利用して生きているのではないかという仮説を立て、本研究を実施しました。

いわば「光合成」「化学合成」につづいて「電気合成」とでも言うべき反応を発見したぞ、という話。ではこの3つはそもそも何なのか、について解説したい。

よくSFで「あの星には生命反応があるぞ」というセリフがある。たぶん生命体のみが発する固有のオーラみたいなのを観測してるんだろうけれど、残念ながら現代科学はそういう意味での「生命反応」は存在しない。生物も無生物も単なる物質のカタマリで、その並び方が違うだけだと考えられている。

しかし強いて解釈すると、あれは「有機物を検出した」という意味だと思われる。有機物は炭素を骨格にした物質という意味で、生物は頻繁にこの有機物を合成しているが、無生物から有機物が生み出されることはほとんどない*1。なので、星が有機物で満ちていたら「生命がいるっぽい」と見当をつけることが出来る。

有機物は主に炭素でできているので、燃やすと熱エネルギーを発してCO2になる。では逆に、CO2とエネルギーから有機物を合成することは出来るだろうか?

ご存知のとおり、人類はそういうことは出来ない。人は、すでに有機物になったご飯や野菜や肉を消化して取り込むことしかしない。このように他の生物の生み出した有機物を食べるものを従属栄養生物という。

もちろん消費者だけでは経済が成り立たないので、なかにはCO2とエネルギーから有機物を合成する独立栄養生物がいる。代表格はもちろん植物であり、彼らは光のエネルギーによってCO2から有機物を合成している。

一方、深海のような光がまったく届かない場所では、べつのエネルギーから有機物を合成する生物がいる。それが化学合成細菌である。硫化水素 H2S を硫黄 S に酸化してエネルギーを得る硫黄細菌や、鉄イオン Fe2+ を Fe3+ に酸化する鉄細菌などが有名だ。あまり我々の生活に縁はないが、原始の生命は深海で生まれたと考えられているので、彼らの存在がなければ今の我々の隆盛は無かっただろう。先人に感謝しよう。

今回発見されたのは鉄細菌の一種 A.ferrooxidans が電気を通しやすい岩石の近くで暮らしていたので「もしかして鉄がなくても電気エネルギーを直接吸ってるんじゃね?」と試してみたら実際そうだった、という話のようだ。電気をメインで利用してるという意味ではないようだが。

こうなると次は核エネルギーを利用する細菌が欲しいが、今のところニセ科学界隈でしか見つかっていない。オクロの天然原子炉を探せば見つかるかもしれない。

*1:もちろん皆無ではない。1828年にヴェーラーがはじめて無機物から有機物を合成できることを発見し、有機物こそが生命の源とする考え方が覆された。