自然言語処理の前処理を実装

This article is automatically generated from the original content 記事に対して機械翻訳を含む自然言語処理を行えるようにするため、人間が記述するMarkdownの自然言語部分のみを取り出す処理を書きます 正規表現で全て判別できたのでわりあい簡単にできた 要件 Markdownで記述している記事の内容を、機械翻訳を含む任意の自然言語処理に渡せるようにする 仕様 Markdownをある程度パースして自然言語の文のみを抽出する 直近で使うのは他言語コンテンツ自動生成における機械翻訳なので、生成処理の部分を置き換える 実装 Markdownパーサー 行ごとに分割したうえで、自然言語ではない以下の構文を取り除く Hugoの制御構文である ^\n*---\n(\n|.)*?\n---\n Markdownのprefixである ^(>|\s*(#####|####|###|##|#|- \[ \]|- \[x\]|-|\d+\.)) 他言語コンテンツ生成処理の変更点 機械翻訳は未着手なのでとりあえず「機械生成の文ですよ」という一文を挿入する Reference Pull Request 翻訳スクリプト

July 14, 2022

Multilingualization

Requirements make English version of the contents those are in the original language (Japanese) to make them use a machine translation[^1] manually write an English contents if possible[^2] ^1: I need a hook that the machine translation is triggered in the build phase ^2: the build phase must distinguish the contents those are manually written to not override them by machine translation Multilingualization on Hugo Hugo automatically publishes multilingual sites by preparing a content file with the same name for each languages....

July 9, 2022

2022-07-08 論文

This article is automatically generated from the original content 論文 Where did the pupa come from? The timing of juvenile hormone signalling supports homology between stages of hemimetabolous and holometabolous insects https://royalsocietypublishing.org/doi/full/10.1098/rstb.2019.0064 定期的に話題に上る「蛹の起源」について。 2大学説(「蛹=終齢幼虫」vs「蛹=全幼虫齢」)についてレビューし、変態制御遺伝子群の機能からも検討。 https://twitter.com/Cyclommatism/status/1545369213212463105?s=20&t=SkllRtNcehkcRyMvwd1GyA Weight Agnostic Neural Networks Neural netの接続トポロジーのみを進化的計算で求め、学習(結合荷重の最適化)を省略することで高速に計算する手法 https://weightagnostic.github.io われわれががんばって学習させていたのは一体…? 学習ありの場合の進化計算よりは時間かかる(要するに結合加重込みのトポロジーの最適解を求めているので)と思うのだけどどうなんじゃろ

July 8, 2022

Collective Intelligence in Living/NonLiving System

This article is automatically generated from the original content Collective Intelligence in Living/NonLiving System 何が生物の集団の中の個体の元気さを決定するのか? boidの個体数を1000~100000と変化させ群れの変動や密度を計測すると fluctuation: 変動 perspectives on collective vitality 0. Excitable media as a common property Kinetic energy / templature Susceptibility of a collective Network structure Tetrahymena 水中の単細胞

July 8, 2022

このサイトについて

This article is automatically generated from the original content 自分の思索やらを記録しておきたいという要望が以前からあり、今までは物理のノートやTwitter, note, Zennや社内wikiなどに書いていましたが、 データが手元に残らないため失われる可能性がある 一元管理できない 内容を機械処理(翻訳、言語解析等)にかけるのが面倒 relationalな内容をそのように管理/取り扱いすることができない という問題がありました。 relationalな内容の管理とは、アイデアや思想はその周辺のアイデアとのつながりがあってこそ活きるので、人間の頭の中で起きているような連想を行える何者かのことです。 要件 サイトのコンセプトが要件です なんでも書ける 書いたものはローカル/GitHubに残せる 書いたものを構造化できる 書いたものを後処理にかけられる 仕様 Git管理にする 静的HTMLをホスティングする 動的にする理由もないし… ホスティングはGitHub Pagesを利用 楽やねん ジェネレータはHugoを利用 なんでも良かったのだが、元コンテンツをMarkdownで記述できることと、GitHub Pagesが利用しているJekyllはGitHub Action上での変更容易性がなさそう&Ruby製なので中立のHugoにした ビルド&デプロイはGitHub Actionを利用 楽やねん relationalな内容の管理 どうしようね? 実装・運用 静的HTML生成〜公開はHugoのドキュメンテーションが詳しく、おおよそ詰まらずにできた → Hugoを使用したGitHub Pages用の静的HTML生成 relationalな内容の管理 実装を試みたことはある(BidirectionalEditor)がデータがない状態ではモチベーションが続かなかったので、まずコンテンツを拡充するのが当面の目標。 各記事/記事中の用語に対してその説明/他の記事が紐づけられていて、ユーザー体験としては相互にリンクされたそれを自由に行き来できるというものになるはず。 静的HTML + 手作業で行うこともおそらく可能なのでスモールスタートでやってみてもいい。 本格的に機械的に行うなら毎ビルド時に総ざらいするよりDB入れたほうがいいが…とりま体験を先に作ってみましょう。 その他 GitHub ActionでHugoのビルドに使用している peaceiris/actions-gh-pages@v3 はかなり用途が特定されている印象があるので複雑な処理を挟む場合は自前で書き直すかも 記事の体を成すものはですます調、それ以外は適当

July 7, 2022

2022 07 07 15:04:04.782474

This article is automatically generated from the original content 人工生命研究会#4でお勧めされた本 Rolf Pheifer 知能の原理 Niklas Luhmann 自己言及性について Humberto Maturana 知恵の樹 ウムベルトの本 身体化された心 精神と自然 肝心の勧められた理由を忘れた DDD関連でお勧めされた本 エンタープライズアプリケーションアーキテクチャパターン みんな読んでるのは実践ドメイン駆動設計

July 7, 2022

Test

This is a test article written in English. In the Japanese page, there’s Hugo cheat sheet.

July 5, 2022