ビッグデータ、データサイエンティストなど流行言葉も含む、統計学全般のグループです。
はてなブログを持っていれば、誰でも参加できます。
さて、今回は一様分布の上限の推定方法の比較を行います。初めに簡単に問題設定から。 が独立に、範囲≦≦の一様分布に従うような状況を考えます。 この時、最尤推定法を用いて、の推定量を考えると、になるのでした。ここまでの内容に関しては、既に以下の記事で触れていますので、初耳!という方は以下をご覧ください。 www.bananarian.net今回は、の推定量は本当にで良いのか。もっとよりよい推定量は存在…
web.archive.org 通称「親日度調査」というらしいです。 韓国・中国・台湾・香港・タイ・インドネシア・インド・アメリカ・オーストラリア・イギリスの世界10カ国の国民に「日本が好きですか?」と尋ねたところ、「嫌い+大嫌い」の合計値が前回調査(2020年)と比べて増えた、という内容の記事です。なぜかインドネシアのみ減った、と。 コロナ禍で海外旅行もままならないなか、いったいどんなわけで日本…
位置情報系の分析をしていると、店舗などの住所情報を緯度経度に変換したいケースがあるかと思います。今回は2020年12月にリリースされたAWSの位置情報サービスであるAmazon LocationをPythonから操作することでテキストの住所から緯度経度情報を取得してみました。 Amazon Locationとは Amazon Locationとは、2020年12月にリリースされたAWSの位置情報サ…
この記事は何 全般 データ型・データ数・カラム名を取得する 欠損の有無を確認する 列に含まれる値に指定した式を適用する オブジェクト型となっているカラムのデータを変換する 指定した行・列のデータを抽出する マークダウン・Latex形式で出力する 特定データに対する操作 数値データ pandas.Seriesの要素同士の足し算・引き算・比較をする 指定した列の平均や中央値などの統計をまとめて計算する…
常に成果を求められる外資系では、仕事ができなければ解雇されてしまいます。仕事ができるとは、設定された目標(売上目標や利益目標など)を達成することと考えられます。外資系の場合、目標達成率がたとえ95%であっても、10%であっても未達は未達として一括りにされることもあり、100%以上の達成率でない限り解雇の理由として会社に利用される口実になるため、多くの人々が目標設定の段階からセンシティブになります。…
統計学の上級者さんはたまに、「相関係数は2つの偏差ベクトルがなす角の余弦である。」という説明をします。 実際これは非常に直感的で理解しやすい解釈なのですが、ド文系の私は最初何を言っているのかわかりませんでした。 視覚的に表現することでこの解釈をすんなり理解することができたので、今回はそれを共有していこうと思います。 偏差ベクトルと標準偏差 まず手始めに「偏差ベクトル」から理解していきましょう。数式…
16S rRNAアンプリコンシーケンシングによる菌叢解析をする際、relative abundanceの群間の検定には、多くの論文でLEfSeが使われています。 galaxyproject.org LEfSeのインストールは、一昔前はそれなりに大変で、こんな記事を書いたりしたものです。 pediatricsurgery.hatenadiary.jp 久しぶりにローカルで動かそうと思ったのですが、そ…
「テレビCMやったけどさ、どんだけ効果があったのよ?」と質問されたときにどう回答するのが適切だろうか。 データ分析ができる人にとってはデータさえ揃えば難しい話ではない。投下したTVCMのGRPを説明変数として売上なり申込件数を目的変数とした予測モデルを作れば良い。しかし、データ分析の素養がない人に予測モデルの式本体を見せたところでチンプンカンプンだろうし、報告する人が普通の人だった場合、RやPyt…
突然ですが、中京テレビで放送されている太田上田という番組でくりぃむしちゅーの上田さんがこんなことを言っていました。 九九は五の段より上は覚えなくても計算ができる! 番組が気になる方はHuluで全話視聴できます! chuun.ctv.co.jp その方法は? さて、気になる計算方法ですが、まず5より大きく10よりも小さい二つの整数を考えます。 上田さんが紹介した方法では,まず片手それぞれでを指を折っ…
次のページ