講演内容:ベイズ分析において,主観に基づいた事前分布を使用することが望ましくない場面はよくある.それに対する一つの方法は,無情報事前分布あるいは客観事前分布と呼ばれる事前分布を用いることである.例えば,ジェフェリーズの事前分布などが有名であるがどんなモデルにもそれが適用できるわけではないため,文脈に応じて適切な客観事前分布の選択が必要になる.適切な正則条件のもとで,ジェフェリーズの事前分布を正当化する方法はいくつかあり,そのうちの一つに事後信用領域が頻度論的な被覆確率を達成するように事前分布を設計する確率一致法がある.本発表では,その研究背景を説明した上で,密度の台が未知母数に依存する非正則モデルに対して,推定の観点から議論されることの多い確率一致事前分布を予測の観点から考察する.
講演内容:観測されたデータに外れ値が含まれている場合,未知パラメータを通常の最尤法で推定するとバイアスが生じうる.Fujisawa and Eguchi (2008, JMVA)で提案されたガンマダイバージェンスを用いると,適当な仮定の下で外れ値に対して頑健な推定量を構築できることが知られている.本発表では,特に回帰問題を考え,ガンマダイバージェンスに基づく推定量の収束レートを導出する.また,得られた結果を説明変数が高次元である状況下での貪欲型変数選択法に適用し,その際の収束レートについても述べる.
講演内容:本発表では, ロジスティック回帰に対するGeneralized Fused Lasso (GFL) を扱う. ロジスティック回帰などの一般化線形モデルのパラメータは, 通常, 推定量が陽な形で得られないため, 目的関数の線形近似式を用いて推定される. 本発表では, ロジスティック回帰のGFL推定量を得るための最適化問題を, 目的関数を線形近似することなく解くアルゴリズムを提案する. 具体的には, 座標降下法の更新式を陽な形で導出する. また, 時空間データへの適用例も紹介する. なお, 本研究は広島大学の栁原先生, 放射線影響研究所の山村先生との共同研究である.
講演内容:高次元データに対して, ユークリッド距離に基づく判別分析は誤判別確率を十分に小さくすることがAoshima and Yata (2014)などで示されている. 一方で, 判別分析ではしばしば冗長変数が問題になることがある. 本発表では, ユークリッド距離に基づく判別分析において, 誤判別確率の高次元漸近理論の枠組みでの近似を与え, 冗長変数について考察する. またKOO法を用いて高次元データでも実行可能な冗長変数を選択する方法を提案し, その変数選択法が一致性を持つことを示す.
講演内容:
心理学の研究実践においては、研究者の興味関心の現象に対する研究仮説を経験的に検証するためのデータを収集し、データを統計処理して、研究仮説についての評価を行うことが多い。
本発表では、1) コミュニケーションに関する現象について項目反応理論を適用した研究事例、2) 心理学における統計学の誤用の問題についての心理学内部での議論、についての話題を提供し、意見交換を行いたい。
講演内容:「大うつ病 (Major Depressive Disorder)」は 罹患する個人の特徴 、症状、症状の変遷に関して非常に異質的である。本研究ではうつ病患者さん (N=267) から毎3カ月、2年間収集した症状の経時データに対して三相主成分分析という統計手法を用いて「個人」、「症状」、「時間」の3つのレベルにおいて因子構造を仮定し、それらの交絡を用いてうつ病の時間的変遷を説明する。また、得られた因子を用いて3年、および10年後のうつ症状の予測を行った。
講演内容:Integrated Ecosystem Assessment (IEA) is a set of approaches used for organizing scientific information at multiple scales, ecosystem components and across sectors to support marine ecosystem-based management. Integrated trend analysis is a way in IEA to summarize changes that occurred in recent decades in ecosystem in the North Atlantic and to highlight the possible connections among the physical, biological, and human ecosystem components. These methods cover graphical analyses as well as univariate and multivariate statistical analyses. The observations considered in the trend analysis are sometimes too short or too sparse for considering statistical model. For such situation, it might be practical to transfer the observations to categorical data like presence/absence at each observed location and explore independent or dependent tendencies among co-occurrent species at each location according to the observed period. To the aim, we provide an approach based on the study by Sakamoto and Akaike 1997.
講演内容:本発表では,一般化 Group Fused Lasso の最適化を目的した,ベクトル差分ノルム型罰則付き二次形式の最小化アルゴリズムを提案し,その収束性を証明する.最小化を行う罰則付き二次形式は微分不可点で最小となることがあるため,まずは,方向微分により微分不可点で最小値となるための必要十分条件を導出する.その後,微分不可点で最小値とならないという条件の下で,偏微分が0となる点を繰り返し計算で探索するアルゴリズムを提案する.この提案するアルゴリズムでは,どのような初期値においても必ず最小値を達成する点に収束することが言える.本発表は,広島大学の大石先生,若木先生,(株) 東京カンテイの岡村先生,伊藤先生との共同研究である.
講演内容:多変量ベータ分布は正定値対称確率行列の分布で,ベータ分布の行列変数への拡張である. 多変量分散分析における代表的な検定統計量である尤度比検定, Lawley-Hotelling 検定統計量, Bartlett-Nanda-Pillai 検定統計量の帰無仮説における分布は, いずれも多変量ベータ確率行列の固有値の関数の分布として表すことができる. 多変量ベータ確率行列の固有値の関数の分布のラプラス近似とその誤差限界を導出し, 3つの検定統計量の分布の近似に適用する.
講演内容:本発表では, 正規性を仮定した多変量線形回帰において一般化情報量規準 (Generalized Information Criterion; GIC) により説明変数を選択するモデル選択問題を扱う. このとき, 予測の観点から, 選ばれたモデルの良さをカルバック・ライブラー情報量に基づく KL ロス関数によって測ることを考える. 本発表では, 標本数は無限大だが目的変数の個数は標本数を超えない範囲で無限大としてもよい高次元大標本漸近枠組みを用いて, GIC により選ばれたモデルが KL ロス関数を最小化するモデルとなる確率が 1 に収束する性質 (一致性) を保証するための条件を導出する. また, 一致性をもつような情報量規準も提案する.
講演内容:This paper introduces a filtering method for the spatial sciences such as spatial econometrics, spatial statistics, and geographic analysis. It can be regarded as an extension of a time series filtering method. We show that it enables us to extract positively spatially autocorrelated constituent of spatial observations. Spatial autocorrelation is fundamental to the spatial sciences because it describes the similarity between signals on adjacent vertices. Thus, the method herein is beneficial for applied studies in the spatial sciences. We numerically and empirically demonstrate how well the filter works and provide Matlab/GNU Octave, R, and Python user-defined functions for implementing the filter. Finally, we discuss some future research directions.
講演内容:極値統計学は確率分布の裾を解析するための統計学である. 分布の裾はextreme value index (EVI)と呼ばれる1つのパラメータがその情報を統括しており,
このパラメータの推定が主問題となる. これまでにEVIの推測研究は整備されてきているが, 近年では, 共変量情報を取り入れた手法, すなわち, EVI回帰研究の発展が望まれている. 特に, 共変量が多次元の場合は次元の呪いに直面することから, これを適切に回避するモデリングを行うことが重要となる.
一方で, 平均回帰などでは次元の呪いを克服する多くのモデリングが議論されている. これらのモデルをEVI回帰に応用し, 極値統計モデリング研究を充実させることが本研究のモチベーションである. 本講演では, EVI回帰にセミパラメトリックモデル, 特にSingle index modelを適用し, 得られた結果を報告する.
講演内容:時系列データに対するノンパラメトリックな平滑化法は数多く提案されており,その一つに正則化に基づくL_1トレンドフィルタリング (Kim et al., 2009) がある.これは2乗損失に基づいた推定であり,ベイズの観点からも縮小事前分布を応用し数多くの研究がなされてきた.また,2乗損失の代わりにチェック損失を用いることで分位点の推定を実現できる (Brantley et al., 2020).本研究では,ベイズによる分位点の推定を目的とし,非対称ラプラス尤度に対し3種類の縮小事前分布を用いた手法を提案し比較する.なお,いずれの事前分布に対してもギブスサンプリングによるMCMCと変分ベイズの2つの手法を構成し,空間(グラフ)上のデータにも適用可能なモデルとして提案する.
講演内容:線形回帰モデルのベイズ推定方法の一つに,Huberized Bayesian Lasso というものがある.これは外れ値に対してロバストな推定を行うために二乗損失関数ではなく,フーバー型の損失関数に基づく方法である.しかしながら,フーバー型の損失関数には,ロバストネスをコントロールする調整パラメータが存在し,その選択は重要である.
本研究では,Huberized Bayesian Lasso におけるいくつかの性質を示し,ロバストネスの調整パラメータにも事前分布を仮定するフルベイズの枠組みで,調整パラメータもデータから自動的に推定が可能な近似的なギブスサンプラーを提案する.また,数値実験と実データ解析により提案手法の安定性を示す.
講演内容:我が国においてがんは2人に1人が罹患するといわれる疾病であり, 有効な対策が必要である.
がん対策の策定・評価に用いられる罹患率・死亡率・生存率といった指標はがんの罹患や転帰情報を悉皆的に調査・収集する住民ベースのがん登録をもとに算出される.
しかし, 一方で, 住民ベースのがん登録は死因情報が不確かであるという問題点をもち, 特に生存率の算出に一般的な生存解析手法を用いることができない.
本セミナーでは, 住民ベースのがん登録に用いられる生存率算出手法の概要を説明するととも, 特に希少がんの生存率指標に関する現在の研究成果について報告を行う.