Weka(기계학습)

Weka (machine learning)
웨카
Weka logo, featuring weka, a bird endemic to New Zealand
뉴질랜드 고유 조류Weka가 특징인 Weka 로고
Weka-3.5.5.png
Iris UCI 데이터 세트를 사용하여 탐색기 창을 연 Weka 3.5.5
개발자와이카토 대학교
안정된 릴리스
3.8.6 (안정적) / 2022년 1월 28일; 6개월 전(2022-01-28)
프리뷰 릴리즈
3.9.6 / 2022년 1월 28일; 6개월 전(2022-01-28)
저장소
기입처자바
운영 체제Windows, macOS, Linux
플랫폼IA-32, x86-64, ARM_아키텍처, Java SE
유형기계 학습
면허증.GNU 일반 공중 라이선스
웹 사이트www.cs.waikato.ac.nz/~ml/weka

뉴질랜드와이카토 대학에서 개발된Waikato Environment for Knowledge Analysis(Weka)는 GNU General Public License로 라이선스된 무료 소프트웨어이며, "Data Mining: Practical Machine Learning Tool and Technics"[1]라는 책의 부속 소프트웨어입니다.

묘사

Weka에는 데이터 분석예측 모델링을 위한 시각화 도구 및 알고리즘 모음과 이러한 [1]기능에 쉽게 액세스할 수 있는 그래픽 사용자 인터페이스가 포함되어 있습니다.원래 비 Java 버전의 Weka는 다른 프로그래밍 언어로 구현된 (대부분 서드파티) Tcl/Tk 모델링 알고리즘과 C데이터 전처리 유틸리티, 머신 러닝 실험을 실행하기 위한 makefile 기반 시스템이었다.원래 버전은 주로 농업 도메인의 데이터를 [2][3]분석하기 위한 도구로 설계되었지만, 1997년에 개발이 시작된 보다 최근의 Java 기반 버전(Weka 3)은 현재 많은 다른 응용 분야, 특히 교육 목적과 연구를 위해 사용되고 있습니다.Weka의 장점은 다음과 같습니다.

  • GNU General Public License에서 무료로 이용 가능.
  • 휴대성은 Java 프로그래밍 언어로 완전히 구현되어 있으며, 따라서 거의 모든 최신 컴퓨팅 플랫폼에서 실행됩니다.
  • 데이터 전처리 및 모델링 기술의 포괄적인 집합입니다.
  • 그래피컬 사용자 인터페이스로 사용하기 쉬움

Weka는 데이터 전처리, 클러스터링, 분류, 회귀, 시각화기능 선택 등 몇 가지 표준 데이터 마이닝 태스크를 지원합니다.Weka에 대한 입력은 Attribute-Relational File Format에 따라 .arff 확장자가 붙은 파일 이름으로 포맷되어야 합니다.Weka의 모든 기술은 데이터가 하나의 플랫 파일 또는 관계로서 이용 가능하다는 가정 하에 상정되어 있습니다.여기서 각 데이터 포인트는 고정된 수의 속성(일반적으로 숫자 또는 공칭 속성)으로 기술되지만 다른 속성 유형도 지원됩니다.Weka는 Java Database Connectivity를 사용하여 SQL 데이터베이스에 액세스할 수 있으며 데이터베이스 쿼리에 의해 반환된 결과를 처리할 수 있습니다.Weka는 Deeplearning4j[4]통해 딥 러닝에 액세스할 수 있습니다.다관계 데이터 마이닝은 불가능하지만 링크된 데이터베이스 테이블의 컬렉션을 [5]Weka를 사용하여 처리하기에 적합한 단일 테이블로 변환하기 위한 별도의 소프트웨어가 있습니다.현재 Weka 분포에 포함된 알고리즘에서 다루지 않는 또 다른 중요한 영역은 시퀀스 모델링입니다.

확장 패키지

버전 3.7.2에서는 확장 [6]패키지를 쉽게 설치할 수 있도록 패키지 매니저가 추가되었습니다.이 버전 이전에 Weka에 포함되었던 일부 기능은 이후 이러한 확장 패키지로 이동되었지만, 이 변경으로 인해 Weka에 대한 확장 및 소프트웨어 유지보수가 쉬워졌습니다.이 모듈러 아키텍처는 Weka 코어 및 개별 확장의 개별 업데이트를 가능하게 하기 때문입니다.

역사

  • 1993년 뉴질랜드와이카토 대학교는 Tcl/Tk, C, makefiles가 혼합된 Weka의 원래 버전을 개발하기 시작했습니다.
  • 1997년 모델링 [7]알고리즘 구현을 포함하여 Java에서 Weka를 처음부터 재개발하기로 결정했습니다.
  • 2005년에 Weka는 SIGKDD Data Mining and Knowledge Discovery Service [8][9]Award를 수상했습니다.
  • 2006년 펜타호사는 Weka를 비즈니스 [10]인텔리전스에 사용할 수 있는 독점 라이선스를 취득했습니다.Pentaho 비즈니스 인텔리전스 제품군의 데이터 마이닝 및 예측 분석 구성 요소를 구성합니다.Pentaho는 이후 Hitachi Vantara에 인수되었으며, Weka는 현재 PMI(Plugin for Machine Intelligence) 오픈 소스 [11]컴포넌트를 담당하고 있습니다.

관련 도구

  • Auto-WEKA는 Weka의 [12]자동 기계 학습 시스템입니다.
  • Index-Structures에 의해 지원되는 DeveLoping KDD-Applications 환경(ELKI)은 클러스터 분석, 즉 비감독 방법에 초점을 맞춘 Weka와 유사한 프로젝트이다.
  • H2O.ai은 오픈 소스 데이터 과학 및 머신 러닝 플랫폼입니다.
  • KNIMEJava에서 구현된 기계 학습 및 데이터 마이닝 소프트웨어입니다.
  • Massive Online Analysis(MOA)는 뉴질랜드 와이카토 대학에서 개발된 대규모 데이터 스트림 마이닝을 위한 오픈 소스 프로젝트입니다.
  • Neural Designer는 C++로 작성된 러닝 기술을 기반으로 하는 데이터 마이닝 소프트웨어입니다.
  • Orangeskit-learn에 기반한 데이터 마이닝, 머신 러닝 및 시각화를 위한 유사한 오픈 소스 프로젝트입니다.
  • RapidMiner는 Webka를 통합한 Java에서 구현된 상용 머신 러닝 프레임워크입니다.
  • Scikit-learn은 Python에서 인기 있는 기계 학습 라이브러리입니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b Witten, Ian H.; Frank, Eibe; Hall, Mark A.; Pal, Christopher J. (2011). "Data Mining: Practical machine learning tools and techniques, 3rd Edition". Morgan Kaufmann, San Francisco (CA). Retrieved 2011-01-19.
  2. ^ Holmes, Geoffrey; Donkin, Andrew; Witten, Ian H. (1994). "Weka: A machine learning workbench" (PDF). Proceedings of the Second Australia and New Zealand Conference on Intelligent Information Systems, Brisbane, Australia. Retrieved 2007-06-25.
  3. ^ Garner, Stephen R.; Cunningham, Sally Jo; Holmes, Geoffrey; Nevill-Manning, Craig G.; Witten, Ian H. (1995). "Applying a machine learning workbench: Experience with agricultural databases" (PDF). Proceedings of the Machine Learning in Practice Workshop, Machine Learning Conference, Tahoe City (CA), USA. pp. 14–21. Retrieved 2007-06-25.
  4. ^ "Weka Package Metadata". SourceForge. 2017. Retrieved 2017-11-11.
  5. ^ Reutemann, Peter; Pfahringer, Bernhard; Frank, Eibe (2004). "Proper: A Toolbox for Learning from Relational Data with Propositional and Multi-Instance Learners". 17th Australian Joint Conference on Artificial Intelligence (AI2004). Springer-Verlag. CiteSeerX 10.1.1.459.8443.
  6. ^ "weka-wiki - Packages". Retrieved 27 January 2020.
  7. ^ Witten, Ian H.; Frank, Eibe; Trigg, Len; Hall, Mark A.; Holmes, Geoffrey; Cunningham, Sally Jo (1999). "Weka: Practical Machine Learning Tools and Techniques with Java Implementations" (PDF). Proceedings of the ICONIP/ANZIIS/ANNES'99 Workshop on Emerging Knowledge Engineering and Connectionist-Based Information Systems. pp. 192–196. Retrieved 2007-06-26.
  8. ^ Piatetsky-Shapiro, Gregory I. (2005-06-28). "KDnuggets news on SIGKDD Service Award 2005". Retrieved 2007-06-25.
  9. ^ "Overview of SIGKDD Service Award winners". 2005. Retrieved 2007-06-25.
  10. ^ "Pentaho Acquires Weka Project". Pentaho. Retrieved 2018-02-06.
  11. ^ "Plugin for Machine Intelligence".
  12. ^ Thornton, Chris; Hutter, Frank; Hoos, Holger H.; Leyton-Brown, Kevin (2013). Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms. KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. pp. 847–855.

외부 링크