講演内容:ある病気の生存時間や機械の故障時間,地域ごとの平均所得などの正値データは応用上重要であり,古くから研究されてきた.一方,高次元の正値データはその平均の多くがある値の周りに集中していることがある.本研究では,ガンマ列モデルの平均母数に対して共役な逆ガンマ事前分布の形状尺度混合の形で構成される新たな縮小事前分布を提案することにより,スパースな正値データに対する効率的な縮小推定法の開発を行う.また,理論的性質として大きなシグナルに対する縮小のロバスト性とスパース性に対するカルバック・ライブラーリスクの性質を示す.数値実験と実データへの応用を通し,提案手法の有用性を確認する.
講演内容:効果検証の課題に対して,因果推論のフレームワークを適用することは常識となってきている。一方,実社会への適用を考えたときに,変数が直接的に観測できず,あくまで代理指標を用いて分析を行うことが多い(能力,学力など)。一方,代理指標を使う場合,測定誤差の発生により,分析結果にどのような影響を与えるのだろうか。本発表は,複数の交絡変数が考えられる因果モデルに対して,系統誤差を含む代理指標を用いて,それらの交絡変数を統制することの是非について検討していく。結果として,代理指標Pを統制するときに生じる推定バイアス(p-bias)は,四つの部分から構成されていることが分かった。各構成要素は,①交絡変数による内生性問題(即ち脱落変数バイアス,OVB),②OVBに対する部分的統制,③測定誤差がもたらす合流点バイアス,④Z-bias(即ち分散拡大係数,VIF)として解釈出来る。そのうえで,代理指標の測定誤差の参入によるp-biasの挙動を確認したところ,測定誤差が0に近づくときのp-bias漸近値が0にならない場合もあることが分かった。つまり,複数の交絡変数が存在する場合,極端な条件では,測定誤差を完全に排除したとしても,代理指標の統制が,何も統制しないときのOVBよりも大きなバイアスを引き起こす可能性が示された。なお,本研究は広島大学の中尾走先生および広島大学の村澤昌崇先生との共同研究である。
講演内容:順序付きカテゴリカルデータは医学や社会科学など, 幅広い分野で普及している. 例えば, 病気の進行度 (ステージ I, II, III, IV) や, ある政策に対する意見 (反対, 中立, 賛成) などがある.
Ordinal response modelにおけるパラメータの推定法には最尤法や潜在変数を用いたベイズ推定法がよく使用されるが,それらは観測データの外れ値に強く影響を受けることが知られている.
本研究では,density-power divergenceやγ-divergenceを用いて,頻度論とベイズの両方の枠組みでのordinal response modelにおけるパラメータ推定法を提案する.また,提案手法が外れ値に対して頑健であることを,頻度論的枠組みでは影響関数の,ベイズ的枠組みではposterior robustnessの観点から示す.
講演内容:Focused Information Criterion (FIC)は,推定された分布と真の分布との全体的なダイバージェンスを測ろうとする AIC型の情報量規準と違い,興味のあるパラメータの推定誤差(平均二乗誤差)を測ることで得られる情報量規準である.通常,因果推論では因果効果のみを興味のあるパラメータとすることを考えると,FICと因果推論の相性は良いはずである.そこで本講演では,傾向スコア解析における FIC をまずは導出する.また,FICが平均二乗誤差をターゲットにしていることの方に着目し,(因果推論とは別に)説明変数が高次元であるケースも考察する.これは,いわゆる「二重降下現象」が起こるケースであり,FICタイプの情報量規準がその現象を捉えるかどうかを検証する.後者のトピックは,栁原宏和教授(広島大)との共同研究に基づく.
講演内容:観察研究において, 交絡因子の調整は, 興味ある因果効果を推定するうえで重要である. しかし, 未測定の交絡因子が存在する場合, 交絡因子を直接調整する統計手法を適用しても全ての交絡因子が調整されず, 因果効果の推定値に偏りが生じる可能性がある. 操作変数法は, 未測定の交絡因子が存在しても, 因果効果を偏りなく推定しうる方法の一つである. 本発表では, 初めに操作変数法の導入を行い, さらに操作変数法の問題点を説明する. 特に, 操作変数法に利用する操作変数として妥当な変数の選択問題に着目して議論を進めていく. 補助変数が利用できれば, 妥当な操作変数の選択をしながらも, 先行研究よりも緩い仮定の下で, セミパラメトリック漸近有効な推定法を構成できることを紹介する. なお, 本研究の一部は, 横浜市立大学 後藤温先生, および東京医科大学 田栗正隆先生との共同研究である.
講演内容:遺伝子発現量データなど,サンプルサイズに比べて次元数が圧倒的に大きい高次元データの解析手法の1つにカーネル法がある.この手法では高次元データをさらに高次の関数に変換して処理を行うが,この関数の集合は再生核ヒルベルト空間と呼ばれる空間である.本研究では,データの再生核ヒルベルト空間における分散による違いである.Maximum Variance Discrepancy (MVD)を提案し,このMVDに基づく二標本の均一性検定を行う.特に,このMVDが帰無仮説からのずれに対してどのように変化しているのかどうかに着目し,特定のカーネル,特定の分布における挙動を調べた結果を報告する.同様の結果を先行研究で用いられているMaximum Mean Discrepancy(MMD)に対しても導出し,MVDとMMDの結果の比較を行う
講演内容:Hypothesis testing is a commonly used inference tool in many research fields. Null hypothesissignificance testing (NHST) and its -value In particular are ubiquitous in published research fordecades. Much more recently, null hypothesis Bayesian testing (NHBT) and its Bayes factoralso started to be more commonplace in applied research, especially in the social sciences. Ihave been interested in recent years in both the inferential properties of the Bayes factor andhow researchers make use of it in applied research. In this presentation I will start by offering a(very) short overview of NHST and its shortcomings. I will then introduce the Bayes factor anddiscuss some of its properties. Importantly, I will focus on its advantages as well as on itsshortcomings. Finally, I will present preliminary results of ongoing work, showing how socialscientists have been misusing the Bayes factor in various ways. Very importantly, I will alsoponder over the root causes of the identified problems, and I will provide suggestions to improvethe current state of affairs.
講演内容:希少疾患領域においては、十分な症例数を確保できないなどの理由から無作為化比較試験が実施できず、介入前後の変化量と事前に決めた閾値との比較を行う単群試験を実施することがある。単群試験では対照群を設定しないため、治療効果の推定値にバイアスを含むことが指摘されている。また、単群試験を実施した後に、閾値の妥当性やバイアスの程度を評価することができず、試験治療の有効性に関する評価への課題は多い。
本講演では、単群試験と同様な閾値との比較による有効性の評価に加え、バイアスの程度や閾値の妥当性に関する評価を行うための追加の情報を収集可能な試験デザインと推定法を提案する。
講演内容:本研究では, Bureau van Dijk (BvD) 社の世界の上場企業に関する財務情報が収録されたデータベース Osiris から抽出された財務データと, FTSE Russell 社の ESG レーティングデータを結合したものを用いて, 非対称分布族を対数株式時価総額へ当てはめることを検討するとともに, 非対称誤差をもつ両対数モデルを用いて株式時価総額の統計モデリングを行う. さらに, 対数株式時価総額に対して, 正規逆ガウス分布の当てはめも試みる. 本研究は, 探索的データ解析の視点から, データ可視化によって得られた知見を統計モデリングに利用し, さらに情報量規準を利用することによってモデル選択を行う. なお, 本研究は再現可能研究の立場から実施される.