はじめに クラスタリングとハッシュラーニングの部分を完全に理解することはできませんでした。有識者の方がいれば教えて欲しい・・・ 対象読者 教師なし学習で分類を行いたい方。一般的な機械学習の知識、コンピューターサイエンスの知識がある方が対象になります。 背景 教師データが用意できないタスクがある。 教師データが少量しか用意できないタスクがある。 教師なしデータはある。 上記の状況で有効な手法を探すために下記の論文を読みました。 Hu, Weihua, et al. "Learning Discrete Representations via Information Maximizing Self Augmented Training." arXiv preprint arXiv:1702.08720 (2017). 選んだ理由 精度が高い コードが公開されていて再現できそう ベースとなる手法