講演内容:
The usual Laplace's approximation method is used for approximating an integral such as \int_a^b \exp{MF(x)}g(x)dx. Here, it is assumed that F(x) takes the unique maximum at an inner point of the interval (a,b). We introduce an approximation technique for the case that (i) F and g are defined on a region of a space of matrices, and (ii) F takes the unique at the boundary of the domain of the integration. (ii) means that the the gradient vector may not be zero at the maximum point. The generalized approximation method is applied for approximating the null distribution of the Bartlett-Nanda-Pillai test statistics.
講演内容:
選択的推論(選択後推論)は,統計学および機械学習の分野で近年注目を浴びている手法である.モデル選択で用いたデータをさらに使ってナイーブに推論をおこなうと,そのモデルを過大評価したもとでの結果を与えがちになるため,そのモデルが選ばれたという事象を条件付けた推論が行われる.本講演では,因果推論において標準ツールとなっている,セミパラメトリックアプローチに基づく傾向スコア解析において,選択的推論を展開する.具体的には,因果効果が交絡変数の線形和で書けるような最も基本的な因果推論モデルに対し,セミパラメトリック推定量を与える損失関数にL1罰則項を付し,LASSOタイプの推定をおこなうことで変数選択をおこなう.そして,選択された交絡変数の係数に対し,変数選択されたという事象を条件付けたもとでの信頼区間を,漸近論による保証付きで与える.通常のセミパラメトリック傾向スコア解析と同様,結果変数に対するノンパラメトリックな回帰関数のモデリングをなるべくしないことを目指す.
講演内容:がんは, 現在の日本で2人に1人が罹患するいわれている疾病である.
がん疫学はがんの発生の動向やその要因を考察する疫学の研究分野の一つであり,
これまで我が国では, その研究成果をエビデンスとして, 様々ながん対策に活用されてきた.
本セミナーでは, 最近のがん疫学分野の重要課題であるmicrosimulationモデルの話題を中心に, がん疫学の動向と,
それに貢献してきた統計学手法について概説を行う.
講演内容:本研究では,多変量線形回帰モデルにおいて,目的変数の次元と説明変数の個数のどちらもがサンプルサイズとともに発散するような高次元データに対して変数選択問題を考え,変数選択規準の漸近的性質について議論する.具体的には,Cpタイプ規準について漸近有効性を持つための条件を考えていく.また,通常の多変量線形回帰モデルにおける変数選択でしばしば仮定される,目的変数ごとに共通の説明変数を利用するという条件も緩和する.
講演内容:線形回帰モデルにおける外れ値問題への解決策として,ロバストなダイバージェンスを用いた一般事後分布に基づくベイズ推測方法を考える.事前分布として,スパース性を誘導する連続型縮小事前分布を仮定し,ロバストかつスパースな方法を構成する.また,事後分布の効率的な計算アルゴリズムを提案し,数値実験と実データ解析により提案手法のパフォーマンスを検証する.さらに,時系列モデルへの拡張についても紹介する.本研究は,東京大学の菅澤翔之助氏との共同研究である.
講演内容:本発表では, 多変量線形回帰において説明変数を選択する問題を扱う. 一般に, 説明変数の個数が多いとき, 全ての説明変数の組み合わせに対してモデル選択規準を計算することは計算時間上困難となる. そこで, 本研究では, 説明変数の個数が多い場合でも実行可能な正規尤度に基づく簡便なモデル選択法を扱い, その選択法が標本数だけでなく説明変数・目的変数の個数が無限大に発散する場合でも一致性をもつことを示す.
講演内容:Potthoff and Roy (1964) によって提案された一般化多変量分散分析 (Generalized Multivariate Analysis of Variance: GMANOVA) モデルは,時間に関する変化係数とみなすことができる (Satoh and Yanagihara, 2010).そのため,GMANOVA モデルでは,説明変数の選択と変化係数の経時変動を表す多項式の次数を選択する必要がある.本研究発表では,そのような選択を同時に行うことができる階層的な重複を伴う Group Lasso の最適化アルゴリズムを考え, そのアルゴリズムを用いてGMANOVAモデルを推定を行う.
講演内容:Kullback–Leibler divergenceの様な確率分布に類似度を与える指標は,分布推定におけるリスク関数など,統計解析で広く利用される.Wasserstein距離もその1つであり機械学習分野を中心に応用されている.本発表ではWasserstein距離とその基となるMonge-Kantorovichの問題の概説を行う.さらに完全データにおける混合分布に対するWasserstein距離の評価式についても紹介する.
講演内容:階層型を持つデータを想定し, 一般化線形混合モデルを取り扱う.
特に, 線形予測子の切片項に郡内で共通のランダム係数を導入することで群ごとの違いを記述することができる.
この時尤度関数にランダム係数の分布に関する積分を含むことになるため, 例えばガウス・エルミートのような
近似積分が用いられている. 本発表では, ラプラス近似を用いて得られる近似尤度方程式の解として得られる推
定量の有用性について報告する.
講演内容:変数選択を行ったデータでさらに回帰係数の信頼区間を構成したとき, 実際の信頼係数と設定した信頼係数が異なってしまう問題がある.
このような問題を解決するために, モデルが選ばれたという条件の下での推論である選択後推論がよく用いられる.
本発表では, 線形回帰で用いられる情報量規準に関してKOO法によって変数選択をした際の選択後推論を行い,回帰係数の信頼区間を構築する.
講演内容:ゲイリーのcはモランのIとともに空間自己相関の程度を表す代表的な値である。この研究では,スペクトル・グラフ理論/線形代数的グラフ理論で使用されるグラフ・ラプラシアンとその固有値や固有ベクトルを使ってゲイリーのcを再考する。最初に,ゲイリーのcに関するこれらを使った3つの表現を導く。次に,グラフ・ラプラシアンの固有ベクトルのうち空間的によりスムーズなもの(でないもの)が優勢である場合にゲイリーのcは正(負)の空間自己相関をを表す値をとる様子を例示する。最後に,観測誤差が存在する場合のゲイリーのcについて論じる。