タグ

2022年8月26日のブックマーク (9件)

  • Elasticsearch の検索精度のチューニング 〜テストを作って高速かつ安全に〜

    MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...NTT DATA Technology & Innovation

    Elasticsearch の検索精度のチューニング 〜テストを作って高速かつ安全に〜
    sh19910711
    sh19910711 2022/08/26
    "検索精度: テストする機構がない + デグレが発生しても見落とす + 昔のインデクス、クエリでどのようなランキングが出力されていたのか分からない / Ranking Evaluation API: ランキングがどの程度期待したものかを計算"
  • ニアリアルタイムで同期される検索基盤を構築 ~AWS Glueによるデータ同期編~ - コネヒト開発者ブログ

    皆さん,こんにちは!MLエンジニアの柏木(@asteriam)です. ここ最近は検索エンジン内製化プロジェクトに携わっていて,検索エンジニアとして,検索基盤の主にデータ連携・同期の実装を1から構築したりしていました.7月中旬にABテストまで持っていくことが出来たので,ひとまず安心しているところです.ここからはユーザーの検索体験向上のために検索品質の改善に力を入れていく予定です! はじめに 今回新しく検索基盤をAWSのマネージドサービスを活用して構築しました!エントリーでは,タイトルにもあるように,検索基盤の肝であるDBから検索エンジンへのデータ同期をAWS Glueを用いてニアリアルタイムで実施したお話になります.我々は以下の構成で今回の検索基盤を構築しています. 検索エンジン:Amazon OpenSearch Service データベース:Amazon Aurora データ同期(ET

    ニアリアルタイムで同期される検索基盤を構築 ~AWS Glueによるデータ同期編~ - コネヒト開発者ブログ
    sh19910711
    sh19910711 2022/08/26
    "Glue Studioという新しいUIがあり,見やすく簡単に設定できてめっちゃ使いやすい / Job bookmark機能が言うことを聞かない問題 / Glue→OpenSearch間でエラーが発生した場合,なかなか原因を調査して特定するのが難しい"
  • 自然言語処理系の国際会議を雑に説明してみる(修正あり) - Qiita

    自然言語処理業界では、業績という面では国際会議が主戦場となっています。12 NLP分野外の人のために、簡単に主な国際会議を紹介したいと思います。 元々のモチベーションは以下のツイートをうけて、NLP系の会議の読み方を紹介しようと思ったことです。せっかくなら簡単な説明も書こうかなと。 IJCNLPって普通どう発音するんでしょうか? — Hideki Nakayama (@n_hidekey) 2017年7月12日 なお、読み方については、僕の周りはこう発音していた、というだけなので、他の発音してる人もいると思います。 基的にはACL Anthologyに載ってる国際会議3を紹介していきますし、興味のある人はACL Athologyで実際に論文を読んでみてください。 並びは、なんとなく僕が上位だと思ってる順ですが、人や分野によって割れると思ってます。4 突っ込みは大歓迎です。 2017.08

    自然言語処理系の国際会議を雑に説明してみる(修正あり) - Qiita
    sh19910711
    sh19910711 2022/08/26
    "EMNLP: 2020年からはFindingsという制度が導入 + 本会議には落ちたけど、ある程度のクオリティがある論文に対してFindingsという形でPublishすることを認める + arXivと違ってPeer-reviewを受けている、ということがポイント"
  • ニコニコ動画はオワコン化したか? - shibacowのブログ

    概要 定期的にニコニコ動画はオワコンであるとか、ニコニコ動画はあとn年で終了という記事が注目を集める。最近も次の記事が注目を集めた。 ニコニコ動画は確実にあと2~3年で終了する|ワッチョイ|note 「まだニコ動には需要がある」と思ってる人達が一部存在していた件|ワッチョイ|note しかしそのような記事に数字の裏付けあったことはあまりない。 上の記事でも自分の思いが先行しており、もしその仮定が正しいのならばどのようにデータとして観察できるかという話はない。 今回はそれでは上の主張は妥当であるか?もしその仮定が正しいならそれは数値にどのように現れるかという点を検証していく。 上記ブログの主張 上記ブログでは次のような主張を行っている。 今は面白い動画が無く、 (かっては)面白い動画がたくさんあった。そのため視聴者は離反した。 スマホでが主流になり、若い優秀なクリエイターがPCが必要な凝った

    ニコニコ動画はオワコン化したか? - shibacowのブログ
    sh19910711
    sh19910711 2022/08/26
    2019 / "2017年位から再生数は減り、2/3くらいの再生数 + TikTokに流れた可能性は否定できないが、再生数を見るに影響は限定的かも / ゲーム配信により適したプラットホームとの競争"
  • ディープラーニングを用いて約1.8万円の低コスト筋電義手を作りました - もう疲れたので電子工作します

    前回掲載したディープラーニングを応用した筋電義手の記事を予想外に多くの方にご覧いただき、非常に驚いています。こうやって皆さんに反応をもらえると非常に励みになりますね、当にありがとうございます! 今回は開発した筋電動作推定システムを簡易的なロボットアームに適用することで、低コストの筋電義手を作成したので報告させていただきます。(といっても、快適に使用するには程遠いですが、、、、) また、前回の記事でいただいたコメントに対する捕捉情報についても述べていきたいと思います。 実際の動作とコストについて メカ・エレキ・ソフト設計 補足情報 今後について 実際の動作とコストについて 実際に動いているときの動画です。 前回の記事と同様に、手を握った時・反った時・屈曲した時・無造作時の4種類の筋電位パターンをディープラーニングを用いて分類し、分類結果に応じてロボットアームを動かしています。 ディープラー

    ディープラーニングを用いて約1.8万円の低コスト筋電義手を作りました - もう疲れたので電子工作します
    sh19910711
    sh19910711 2022/08/26
    2019 / "手を握った時・反った時・屈曲した時・無造作時の4種類の筋電位パターンをディープラーニングを用いて分類し、分類結果に応じてロボットアームを動かしています / 5000円程度で3軸のロボットアームが買える"
  • ソフトウェア開発者は徹夜してはいけない - ソフトウェア工学研究の日々

    睡眠は大切とよく言われますが、睡眠不足が開発者に与える影響をまじめに調べた面白い論文が、ソフトウェア工学のトップ論文誌 IEEE Transactions on Software Engineering に掲載されていました。ソフトウェア工学研究室助教の Raula 先生から教えてもらいました。 Need for Sleep: The Impact of a Night of Sleep Deprivation on Novice Developers’ Performance - IEEE Journals & Magazine この論文での被験者はイタリアの大学生 45人。Test-First 開発でプログラムを書かせるタスクを行ってもらっています。23人には実験前日に睡眠を控えてもらい、平均で直近20時間程度は寝てない状態になっています。対照群は、前日に平均で6.5時間、通常通り寝た

    ソフトウェア開発者は徹夜してはいけない - ソフトウェア工学研究の日々
    sh19910711
    sh19910711 2022/08/26
    2020 / "睡眠状況の差による影響のほうが、下手をすると開発支援技術などの効果を上回る可能性 / 何かの被験者実験をするときは、被験者には前日にしっかり寝ておいてもらう"
  • 『Rで学ぶ統計的データ解析』林賢一(著)の書評 - StatModeling Memorandum

    統計家やデータサイエンティストを志す大学生・大学院生に読んでほしい、正統派のです。 目次はこちら。コードを含むサポートページはこちら。類書としては『Rによる統計的学習入門』があります。 このの特徴は、親しみやすい説明とRを実行する部分と、背景の数理を説明するガチの数理編の2パートから構成される点です。ふつうだと著者の能力の限界により前半パートだけ集めた、あるいは後半パートだけ集めたになりがちですが、そうはなっていません。数理を専門とする著者が、学生を指導する経験を通して書かれた教育的なになっています。 Rを実行する部分は丁寧で、私も知らなかった関数や引数があり勉強になりました。特に好きだった章は以下です。 2章 データの可視化と要約 10章 ブートストラップ法 11章 Rを用いたシミュレーション:数理統計学を「実感」する それぞれの章末にある練習問題 早速2章に可視化を据えるとこ

    『Rで学ぶ統計的データ解析』林賢一(著)の書評 - StatModeling Memorandum
    sh19910711
    sh19910711 2022/08/26
    2020 / "親しみやすい説明 + 背景の数理を説明するガチの数理編 / 数理を専門とする著者が、学生を指導する経験を通して / 統計学で行列がどのように使われるのか、どう役に立つのかをきちんと見せてくれます"
  • Deep Learning で音楽を作成するにはどうしたらいいの ? - builders.flash☆ - 変化を求めるデベロッパーを応援するウェブマガジン | AWS

    こんにちは、AWS機械学習ソリューションアーキテクトをしている卜部 (うらべ) です。皆さま、突然ですが良い音楽ライフを送っていますか !? 私は音楽を聴くのも演奏するのも大好きです ! ちなみに今はラモーンズ※ を聞きながらこの記事を書いています。最近は在宅ワークも多いですが、打ち合わせの合間に好きな音楽をかけて一人ヘッドバンギング※ をすると力が湧いて「全部私にまかせとけ !!!」という強い気持ちになれます。あくまで気持ちだけですが。。 近頃はいわゆる「巣ごもり需要」で楽器や DTM※ 関連の売り上げが増えたという話を聞きます。スマホやタブレットのアプリも充実しており、家で手軽に楽器演奏や作曲の機会が増えたのは非常に喜ばしいですよね。一方で、仲間と音を合わせたりライブや発表会で演奏したりする機会が減ってしまい寂しく感じています。仕方がないので、カラオケ音源やルーパー※ に合わせて一

    Deep Learning で音楽を作成するにはどうしたらいいの ? - builders.flash☆ - 変化を求めるデベロッパーを応援するウェブマガジン | AWS
    sh19910711
    sh19910711 2022/08/26
    "DeepBach: MiniBach と同様にバッハのコラールデータセットを用いて、コラール形式の音楽を生成 + 擬似ギブスサンプリングとよばれるアルゴリズムを使って、演奏にランダム性を取り入れたり、人間の意向を反映"
  • データサイエンティストに同じクエリは二度も通じぬ

    sh19910711
    sh19910711 2022/08/26
    2019 / "y-bar/mmetrics (R): 異なる集計軸でのクロス集計を簡略化 + 集計する指標は一度登録しておけば使いまわし可能"