講演内容:外れ値などに代表されるデータの異質性は生存時間解析における推測結果に大きな影響を及ぼす。本発表では,パラメトリックな生存時間モデルである Accelerated Failure Time (AFT) モデルのロバストなベイズ推定について考える。特に,ガンマ分布の尺度混合に基づく生存時間に関する新たな確率分布のクラスを導入し,パラメータの事後分布のロバスト性について議論する。提案モデルの一般化ガンマ分布への拡張についても時間が許せば触れることにする。
講演内容:マクロ時系列分析の分野において、消費者物価指数の分析は伝統的にボラティリティモデルによって行われてきた。一方で、財・サービスの分類ごとに算出される個別の物価指数においては、価格が変化しなかった期間の指数(変化率)が厳密にゼロになるため、そのまま当該モデルを適用するとボラティリティを過少に推定するおそれがある。本研究では正の確率でゼロを生成する構造(ゼロ過剰性)をボラティリティモデルに導入し、分類毎の指数の分析に応用する。ゼロ過剰性は動的ロジットモデルによって表現され、推定にはポリア・ガンマ拡大法を用いた効率的なギブス・サンプラーが用いられる。講演にあたっては、研究で用いる基本的なモデルと計算手法として、動的線形モデル、ボラティリティモデル、ポリア・ガンマ分布と二項尤度のデータ拡大についても概説する。本研究はGeonhee Han氏との共同研究である。
講演内容:生物の成長を予測することは応用上非常に重要なことであり,その際は成長関数を用いた成長曲線モデルを用いるのが一般的である.成長曲線モデルを用いた解析においては成長関数の最小二乗法を用いたパラメータ推定が必要である.しかし,成長曲線モデルの残差平方和がパラメータに関する凸関数でないことから最小化問題の局所解が複数存在し,得られる推定値がどの局所解に収束するかが初期値に依存するという問題が発生する.そこで本発表ではパラメータ推定における探索範囲を縮めた残差平方和の最小化アルゴリズムを提案する.本研究は,札幌医科大学の加茂先生と広島大学の栁原先生との共同研究である.
講演内容:Mallows (1973) により提案された,標準化予測平均二乗誤差に基づくリスク関数の推定量であるCp 規準は,重回帰モデルの変数選択規準として現在も広く用いられている.しかしながら,Cp規準はリスク関数に対して不偏性を持っているわけでない. リスク関数の不偏推定量として,Fujikoshi & Satoh (1997) により初めて,多変量線形回帰モデルにおいて,modified Cp (MCp) 規準と名づけられた変数選択規準が提案された.以降,モデルや推定法を拡張した MCp規準が提案されている.本発表では,モデルや推定法を拡張するときにどのような難しさがあるのかを述べ,現状MCp規準がどこまで拡張できているかを紹介し,これからの拡張可能性について議論する.
講演内容:高次元線形回帰モデルにおける主要な問題の一つは,回帰係数や良い推定量や目的変数の良い予測値を構築することにある.これらの良さの尺度としてターゲットとなる量への収束レートを考える.本発表では,回帰係数に弱スパース性を仮定した場合の minimax レートについて概説し,共変量シフトや外れ値が生じる状況など,通常の高次元線形回帰モデルで考えられているものとは異なる状況における収束レートについて考察を述べる.
講演内容:The sum of squared first differences, as in the von Neumann ratio and the Durbin-Watson statistic, can be represented as the quadratic form of a graph Laplacian. Similarly, the sum of squared seasonal differences, which is used to measure seasonal autocorrelation and to represent a Matheron's classical variogram estimator, can also be represented as the quadratic form of a graph Laplacian. The eigenvalues of the former graph Laplacian are well known. What about the eigenvalues of the second graph Laplacian? Actually, they are known. In this paper, after reviewing them, we provide intuitive commentaries on the results using notions from spectral graph theory. We then use them to establish some properties of the seasonal version of the von Neumann ratio.
講演内容:多変量線形回帰モデルにおいて予測の観点から説明変数を選択する際, サンプル内予測とサンプル外予測の2通りの予測が考えられ, 対応するリスク関数の振る舞いもそれぞれで異なる. 本発表では, サンプル内予測とサンプル外予測に対するリスク関数として平均多変量基準化予測2乗誤差を扱う. これらリスク関数の相違点を述べ, サンプル外予測に対するリスク関数の不偏推定量を構築する.
講演内容:同一個体から複数の項目に対して複数回, 回答を収集した際に得られるデータは3相データと呼ばれる構造を持つ経時測定データとみなせる. 3相データに対して, 個体ごとの特徴を表す説明変数 (個体間説明変数), 項目ごとの特徴を表す説明変数 (項目間説明変数) 及び経時トレンドを用いて解析する統計手法としてThree-mode GMANOVAモデル がある. 本発表では個体間説明変数および項目間説明変数が未知または既知の場合に分けた推定法を提案する.
講演内容:有限混合モデルはクラスタリングや密度推定に応用される重要な統計モデルである.有限混合モデルを 用いる際には混合数を事前に決めなければならないが,その選択は非常に難しい問題である.ベイズ統計学では,混合数を推定するために混合数に事前分布を仮定した有限混合の混合(mixture of finite mixtures, MFM)がよく用いられる.本研究は混合比率の事前分布として通常使用されるディリクレ分布ではなく,正規化逆ガウス分布に基づく MFM による混合数の推定を行う.当日の発表では,数値実験を通して提案手法の性能を確認し,今後の課題を述べる.
講演内容:抗悪性腫瘍薬の臨床第二相試験は、単一の癌腫を対象とした単群試験で実施されることが多く、簡明な正確二項検定による推測が広く用いられている。近年の分子標的治療の発展から標的分子を共有する複数の癌腫を同時に組み入れるバスケット試験が注目を集めている。異なる癌腫間の情報を利用して推測を効率化するための解析手法が多数提案されているが、その大半は複雑なベイズ流の方法に基づいている。本研究では頻度論流の単純な解析法を議論する。情報共有には古典的なMantel-Haenszel型推測の考えを利用し、薬剤が有効な癌腫(バスケット)の同定に一般化情報量規準を利用する方法について議論する。
講演内容:The group lasso performs selection of grouped covariates in statistical models, for example when data include categorical covariates with multiple levels. In practice, one is interested in conducting statistical inference on the selected model parameters only. Statistical inference then needs to account for the selection step to avoid data snooping and the subsequent loss of type I error control. To that end, selective inference conditions on the event of selection. We develop a method of selective inference for estimators after selection by the group lasso with randomization for a general class of models, including generalized linear models and quasi-likelihood models. The added randomization term allows us to rewrite the selection event such that an asymptotic post-selection likelihood can be obtained on which we base inference. Moreover, the resulting confidence intervals for the selected coefficients are bounded, unlike previous methods for selective inference without randomization such as the polyhedral approach. Through experiments on simulated data, we demonstrate that we obtain higher power than data splitting, while controlling the type I error rate. The method is illustrated on data from the National Health and Nutrition Examination Survey (NHANES) (Centers for Disease Control and Prevention (CDC) - National Center for Health Statistics (NCHS), 2021) as well.