放送中のテレビ番組視聴率がリアルタイムで分かる。国内最大級のテレビデータを持つスイッチメディア運営。「今」みんなが視てる番組をTVAL nowでチェック。
サービスURL https://lab.ndl.go.jp/ngramviewer/ 概要 OCRによって作成されたテキストデータから、出版年代ごとの単語及びフレーズ(以下「キーワード」といいます。)の出現頻度を可視化・列挙することができるサービスです。 可視化グラフの縦軸は、年代ごとにキーワードが何回出現したかを表す出現頻度と、出現頻度を出版年代ごとの総ngram数で割った値を表す出現比率の2種類を切り替えることができます。 2023年1月現在の対象は、国立国会図書館デジタルコレクションで提供されているデジタル化済み資料のうち、図書約97万点及び雑誌約132万点のOCRテキストデータから集計した、約17億種類のキーワードです。 具体的な内訳は次の通りです 図書及び雑誌約230万点(約17億種類のキーワード) 図書約97万点(約8.5億種類のキーワード) 雑誌約132万点(約8.9億種類の
「ツイッターで見た」計算社会科学という学問があります.社会科学にコンピュータサイエンスを導入して,これまでにない分析を行おうという学問です.最近日本でも計算社会科学会が発足するなど今盛り上がっている研究分野です. そんな計算社会科学の分野で扱われる課題の一つに,ソーシャルメディアによる社会の分断の分析があります.アメリカ大統領選や新型コロナ禍でフェイクニュースを目にする機会が多くなりましたが,フェイクニュースや偏った情報の取得は,人々を分断させ社会を混乱させると言われています. 分断を生み出す要因の一つが,エコーチェンバー現象にあると言われています.これは,ソーシャルメディアなどでは自分と似たような価値観を持つ人とつながりがちであり,自分の意見をいうと周りから「そうだそうだ」と同意を得られ,自分の意見が社会全体の意見のように見えてしまう現象をいいます.実際にはソーシャルメディアで可視化され
最近ある YouTuber に急にハマった。その人は音楽系やゲーム系などいろんな YouTuber たちとコラボしていて、誰と誰が繋がっているのか把握するのが難しかったので、図にしてみようと思った。 方法 YouTuber 同士の繋がりやコラボレーションを可視化しているプロジェクトはいくつかあったので、参考になる方法がないか探してみた。 おすすめチャンネル欄を使う www.gugelproductions.de この記事では、あるチャンネルが別のチャンネルをおすすめチャンネル欄で紹介していれば、そこに繋がりがあると判定して、その繋がりを可視化していた。 こういうやつ けれどおすすめ欄には大抵サブチャンネルやグループのメンバーのチャンネルくらいしか入っておらず、逐一コラボ相手を載せる人は少ないので、この方法では不十分そうだった。 Twitter を使う datalion.com ここに載って
Google、オープンソースのモジュール依存関係を分かりやすくグラフ化してくれる「Open Source Insights Project」公開 Googleは、さまざまなオープンソースソフトウェアがどのような依存関係にあるかを一覧表示やグラフ化表示などで示してくれるWebサイト「Open Source Insights Project」を発表しました。 Introducing Open Source Insights! This exploratory visualization site provides an interactive view of the dependencies of open source projects, and so much more. See the benefits ↓ https://t.co/CgXUMCeTaZ — Google Open So
Deep Learningという言葉を色んなところで聞くようになり、Googleからも TensorFlow というものが出たし、そろそろちょっと勉強してみるか〜 ということで初心者が機械学習に手を出してみた。 TensorFlowのtutorialを見てみると、まず最初に「MNIST」という手書き文字の識別問題が出てくる。その問題に対して、こういうモデルを作ってこうやって学習させていくと91.2%くらいの識別率になります、さらに飛躍させてこういうモデルでこうやって学習させると99.2%くらいまで識別率が上がります、とか書いてあって、確かになるほどーと数字で納得もできるのだけど、せっかくなら実際にその学習結果を使って自分の書いた数字を識別してもらいたいじゃないか、ということで そういうのを作ってみた。 https://github.com/sugyan/tensorflow-mnist c
by franlhughes 世界王者クラスのレーティング2861から、いったいどうすればそこまで下がるのかというレーティング215まで、様々な腕前のプレイヤーが残した棋譜データを用いて、チェスではどんな戦いが繰り広げられているのかを可視化した人が現れました。 A Visual Look at 2 Million Chess Games http://blog.ebemunk.com/a-visual-look-at-2-million-chess-games/ Buğra Fıratさんは自らチェスのデータの可視化を行うスクリプトを書き、データ分析を行いました。 データのもとになったのは、チェス専門誌・The Week in Chessに掲載された1801年から2013年までの220万戦以上の棋譜を、RebelというサイトがPGNファイル化したもの。ここから変則チェスであるチェス960の
[2016/6/8 data update] 以前、大阪都構想住民投票結果の地図を作った際に、大阪市のオープンデータの中に犯罪発生個所データがあるのを発見したので、そのなかから「ひったくり発生個所」データを視覚化してみました。 大阪市市民の方へ 大阪市の犯罪発生情報 example データの読み込みと整形処理が結構重いので、ページが表示されるまでに時間がかかります。 画面上位にある「被害者の年齢」や「事件発生時刻」のヒストグラムは、バーをクリックするとデータの絞り込みを行えます。グラフの空白部分をクリックすると、絞り込みを解除します。 地図上のエリアをクリックすると下に事件に関するデータを表示します。 めんどうだったこと 公開されているcsvの町名の一部が旧漢字だったため、e-statから取得した町丁目境データと名寄せするのがめんどくさかったです。 本来は新漢字に寄せた方がよいのでしょうが
ジャンプの掲載順位のデータがあったので可視化した. データの収集 ジャンプ掲載順考察というサイトで週刊少年ジャンプの掲載順のデータが公開されている.例えば,最新号の掲載順のデータ(2015年第20号)を見ると,過去10週分の掲載順のデータが記載してある.掲載順のページの表記法については以下のページに記載してある. ジャンプ掲載順考察のデータ採録方針および凡例 上記のページを参考にして,以下のスクリプトでデータを収集する. 収集したデータは以下のページにある. 2003.csv 2004.csv 2005.csv 2006.csv 2007.csv 2008.csv 2009.csv 2010.csv 2011.csv 2012.csv 2013.csv 2014.csv 2015.csv データの可視化 例によって適当に可視化してみる.まず始めに,「NARUTO」の掲載順位の推移を見てみる
去年から公開されてる「JR東日本アプリ」ですが、機能の一つに「山手線トレインネット」というものがあります。 これは山手線の各車両の現在位置、混雑状況、室内温が見えるというもので、 座りやすい車両を探すのに便利だったりします。 山手線トレインネットから取得した車両位置と混雑率 電車の運行情報がここまで時間粒度細かく公開されているのは世界的にも珍しいので、特に目的も無しにデータをクローリングして遊んでみました。 データをクローリングする まずは山手線トレインネットの車両位置・混雑情報をクローリングします。 JR東日本アプリの山手線トレインネット。 今の車両内の混雑や室内温が見える。すごい! 「山手線トレインネット」はブラウザから見えるページが存在しない、iPhone/Androidアプリ専用の画面です。 なので普段の「FirebugでAJAXの通信を見てAPIをリバースエンジニアリング」ほど簡
60歳のおっさんが大学時代の学費は物価も考慮すると現在の8万円です。月に7千円稼いだと自慢してるのです。 というツイートを読み、学費を払うのにバイトしなきゃいけない時間ってどれ位変化したんだろう?と気になったのでイメージを掴むため大雑把に計算してみた。 (今回はざっくりと理解することが目的なのであまり検算やミスチェックをしてない。恐らくどこかにミス有り) 社会でお偉いポストについてる人が「俺らの頃は大学の授業料なんか自分で稼いだもんだ」と言い出したときのためのグラフを置いときますね。60歳のおっさんが大学時代の学費は物価も考慮すると現在の8万円です。月に7千円稼いだと自慢してるのです。 pic.twitter.com/mPa5KGhEsU— 中迎 聡(今日も明日も18歳) (@nakamukae) 2014, 10月 16 結果は最低賃金の高い東京都の場合でこんな感じ。 1975年から20
コミックマーケット来場者の実情がわかるインフォグラフィックスを制作、CCで公開!「モバイル空間統計×メディア・ライフスタイル調査で見る人の動きと来場者プロフィール」 株式会社ドコモ・インサイトマーケティング(本社:東京都港区、代表取締役社長:大竹口 勝)と株式会社角川アスキー総合研究所(本社:東京都文京区、代表取締役社長:角川 歴彦)は、世界最大規模の同人誌即売会である「コミックマーケット」の来場者について、両社それぞれが持つマーケティングデータによって集計・分析し、結果をインフォグラフィックス(複数のデータ等を、視覚的にわかりやすくまとめた一枚絵)にまとめて公開・配信を開始いたしました。 広く一般にも認知されるようになり、多様なジャンルの作品が出展され、多くの人が集まるようになったコミックマーケット。どのくらいの人がどこからきて、彼ら/彼女らはどういった属性を持っているのか、ドコモ・イン
Googleが公開しているデータベース「Freebase」にはさまざまなデータが保存されており、誰でも無料で閲覧できます。そのFreebaseに登録されている歴史上の人物や社会に功績を残した人たちの「生まれた場所」と「亡くなった場所」のデータを解析し、どのようにして人が文化や知識を世界に広めていったのか、世界地図上で可視化したアニメーションが「Charting culture」です。 Humanity's cultural history captured in 5-minute film : Nature News & Comment http://www.nature.com/news/humanity-s-cultural-history-captured-in-5-minute-film-1.15650#/b1 Charting culture - YouTube イタリアのルネサ
自分のためのメモ。 因子分析したら因子分析の結果だけ,構造方程式モデリングしたらパス図だけ,そういうのはちょっと好かない。殆どの場合相関行列があればそういうのは再現できるし,相関行列だって上手に可視化したら,例えば因子分析くらいの見通しはつく。これは,研究報告の透明性というのにもつながる。 ただ論文には紙幅の都合があって,いつでも,というわけにはいかないけど。 とにかく多変数の相関行列に対応するようなデータの可視化について,Rを用いてメモしていく。自分ですぐ忘れてしまうから。 (スクリプトの中に不自然に半角スペースとか入っているのは,hatena記法と変に被るところを避けるため) 散布図行列(SPLOM) 一番てっとり早い方法。 まずRのデフォルト関数で「データフレーム形式」でデータを読み込む。 例えばエクセルからクリップボードにコピーした状態なら, dat<- read="" table
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く