2023/03/13
午前中で確定申告を済ませる。
ACCEAで研究発表の準備などをする。
花粉症で頭があまり働かずにぼーっとしている。
家の内見で移動、家で少し作業をし、野球のオーストラリア戦を見て寝る。
2023/03/12
水曜日のプレゼンの資料作成などをする
引っ越し先の内見など。またヨドバシでホームルーターの相談。
夕方からギター合奏の練習で目黒へ。ギターの合奏は楽しい。
2023/03/11
研究活動では語句の出現頻度の分布などを調べる。低頻度語と超高頻度語をフィルタリングすれば計算回りそうなデータ数まで落ちそう。
勉強会では企業間取引ネットワークの数理構造を分析した論文を読み合わせる。取引高の大きさが売上高の α 乗に比例するという話など
野球の日韓戦を見る。寝る。
2023/03/10
先生と来週の研究発表の打ち合わせ。資料作らねば。雑談の中で不動産業界のことをいろいろ教えてもらう。賃貸持ち家論争などについて。手数料3%のために賃貸と持ち家がトントンになる話など。
来週の学会の発表練習など。なおその分析のために書いたコードがなかなかひどいのでリファクタリグなどに手を付け出す。
木曜日はやはり作業効率が低下する気がする。
勉強会では打ち切りデータがある場合のMCMC (Stan) による推定法などを学ぶ。
帰ってからは引っ越し関連で忙しい。意思決定の速度が必要だ。
2023/03/09
テキスト分析を進める。R の
targets
パッケージで複数パターンの分析を走らせたり、トライアルの分析の記録を残しながら進める最適な方法を模索中。酒を飲むと生活のペースが乱れる。やはり禁酒しよう。
勉強会で傾向スコアについて学ぶ。逆数でウェイトをかけるとバイアスが補正される。まだ腑には落ちていない。そういえばパールの「因果推論の科学」が積読だった読むか。
音声データが入手できそうなのだが、こんな研究があったことを思い出しつつ、何かできないか考えてみる。
- ディテールはわからないけどユニークな研究。面白そう。私もこういう研究をやりたいな。
今日の写真
2023/03/08
最近、研究用分析を進めるにあたって、Rの
testthat
libraryを使って関数の動作確認をしながら進めているが、期待通りの動作となりtestが通るとTest passed 🌈
と絵文字付きのメッセージが返ってくるのが楽しい。朝のジョギング後の風呂で「ウィトゲンシュタインと言語の限界」を読む。気になった箇所
永遠というものを無限の時間的持続と解してはならず、それを非時間性と解さねばならないからだ ----- 「永遠に生きるものは現在に生きるのだ」
否定神学とは、万物の<始原>は万物のいずれでもなく、全てのありうべき述語の否定によってのみ証明されうる、という主張に存する理性的方法である。
- 夜に映画「フォール」を観に行く。私も鳥を貪り喰っていきたい。
2023/03/06
テキスト分析を少しだけ進める。IPA辞書を使ってmecabで形態素解析をして、トークンを見てみると、「!」の品詞が「記号」ではなく「名詞」に振り分けられたりしているので、stop words集合を作って除外したりしていたら出勤時間になった。出勤と言っても在宅勤務だが。明日は出現頻度の分布などを見て、低頻度語を足切りする閾値などを設定しよう。
研究は朝の時間を有効活用するしかない。
企業の情報開示の質や内容が資本コストやボラティリティ、アナリスト予測のばらつきに与える影響を見た論文。好ましい内容だとリスク指標 (すなわち株主資本コスト、ボラ、アナリスト予測のばらつき) は低下する。悪い開示内容の場合はリスク指標が上昇するとのこと。publishが2009年だからか情報コンテンツの分類が粗い気がしており、今だともうちょっと解像度高く分析できそうなネタな気がする。 publications.aaahq.org
しかしテキストと情報量の関係はやはり面白いし、金融分野は情報に対する応答が得られやすいので分析対象として便利なのだな。情報の非対称性とか言ってるし。
今日は統計の勉強会。特性関数は確率密度関数のフーリエ変換に対応するらしいが、どういう経緯でそんな変換をすることになったのかよくわからない。ただこういう変換をすると、モーメントを容易に求めたり、中心極限定理を証明したりできる、という有り難みがあるようだがその続きはまた来週となった。