웨카(소프트웨어)

Weka (software)
웨카
개발자와이카토 대학교
안정적 방출
3.8.6(안정적) / 2022년 1월 28일, 2년(2022-01-28)
미리보기 릴리스
3.9.6 / 2022년 1월 28일, 2년 전(2022-01-28)
저장소
로 적음자바
운영체제Windows, macOS, Linux
플랫폼IA-32, x86-64, ARM_아키텍처; Java SE
유형머신러닝
면허증.GNU 일반 공중 사용 허가서
웹사이트www.cs.waikato.ac.nz/ ~ml/weka

Waikato Environment for Knowledge Analysis(Weka)는 GNU General Public License에 따라 라이센스가 부여된 기계 학습 및 데이터 분석 자유 소프트웨어 모음입니다. 뉴질랜드 와이카토 대학교에서 개발되었으며 "데이터 마이닝: 실용적인 기계 학습 도구 및 기술"이라는 책의 동반 소프트웨어입니다.[1]

묘사

Weca에는 데이터 분석예측 모델링을 위한 시각화 도구 및 알고리즘 모음과 이러한 기능에 쉽게 액세스할 수 있는 그래픽 사용자 인터페이스가 포함되어 있습니다.[1] 원래 비자바 버전의 웨카는 다른 프로그래밍 언어로 구현된 Tcl/Tk 프론트엔드에서 (대부분 제3자) 모델링 알고리즘과 C데이터 전처리 유틸리티 및 머신 러닝 실험을 실행하기 위한 makefile 기반 시스템이었습니다. 이 원본 버전은 주로 농업 영역의 데이터를 분석하기 위한 도구로 [2][3]설계되었지만 1997년에 개발이 시작된 더 최근의 완전한 자바 기반 버전(Weka 3)은 현재 특히 교육 목적과 연구를 위해 다양한 응용 분야에서 사용되고 있습니다. 웨카의 장점은 다음과 같습니다.

  • GNU General Public License에 따라 무료로 이용할 수 있습니다.
  • 자바 프로그래밍 언어로 완전히 구현되어 거의 모든 최신 컴퓨팅 플랫폼에서 실행되기 때문에 휴대성.
  • 데이터 전처리 및 모델링 기술의 포괄적인 모음입니다.
  • 그래픽 사용자 인터페이스로 인한 사용 편의성.

Weca는 몇 가지 표준 데이터 마이닝 작업, 특히 데이터 전처리, 클러스터링, 분류, 회귀, 시각화기능 선택을 지원합니다. Wecka에 대한 입력은 속성-관계형 파일 형식에 따라 .arff 확장자가 포함된 파일 이름으로 포맷될 것으로 예상됩니다. Weca의 모든 기술은 데이터가 하나의 플랫 파일 또는 관계로 제공된다는 가정에 기초하며, 여기서 각 데이터 포인트는 고정된 수의 속성(일반적으로 숫자 또는 공칭 속성)으로 설명되지만 일부 다른 속성 유형도 지원됩니다. Weka는 Java Database Connectivity를 사용하여 SQL 데이터베이스에 액세스할 수 있으며 데이터베이스 쿼리에 의해 반환되는 결과를 처리할 수 있습니다. Weca는 Deep Learning 4j딥러닝에 대한 액세스를 제공합니다.[4] 다중 관계형 데이터 마이닝이 가능하지 않지만 링크된 데이터베이스 테이블 모음을 Weca를 사용하여 처리하기에 적합한 단일 테이블로 변환하기 위한 별도의 소프트웨어가 있습니다.[5] 현재 웨카 분포에 포함된 알고리즘에서 다루지 않는 또 다른 중요한 영역은 시퀀스 모델링입니다.

확장 패키지

버전 3.7.2에서는 확장 패키지를 더 쉽게 설치할 수 있도록 패키지 관리자가 추가되었습니다.[6] 이 버전 이전에 Weca에 포함되어 있던 일부 기능은 이후 이러한 확장 패키지로 옮겨졌지만, 이 변경 사항은 또한 Weca 코어 및 개별 확장을 독립적으로 업데이트할 수 있기 때문에 다른 기능이 Weca에 확장을 더 쉽게 제공하고 소프트웨어를 유지 관리할 수 있도록 해줍니다.

역사

  • 1993년, 뉴질랜드와이카토 대학(University of Waikato)은 Tcl/Tk, C, makefile을 혼합한 Weca의 원본을 개발하기 시작했습니다.
  • 1997년에는 모델링 알고리즘 구현을 포함하여 자바에서 Weca를 처음부터 재개발하기로 결정했습니다.[7]
  • Weca는 2005년 SIGKDD Data Mining and Knowledge Discovery Service Award를 수상했습니다.[8][9]
  • 2006년 Pentaho Corporation은 Weka를 비즈니스 인텔리전스에 사용할 수 있는 독점 라이선스를 획득했습니다.[10] 펜타호 비즈니스 인텔리전스 제품군의 데이터 마이닝 및 예측 분석 구성 요소를 구성합니다. 펜타호는 이후 Hitachi Vantara에 인수되었으며, Weca는 현재 PMI(Plugin for Machine Intelligence) 오픈 소스 구성 요소를 뒷받침합니다.[11]

관련 공구

  • Auto-WEKA는 Weka를 위한 자동화된 기계 학습 시스템입니다.[12]
  • ELKI(Environment for Developing KDD-Applications Supported by Index-Structures)는 클러스터 분석, 즉 비지도 방법에 중점을 둔 Weca와 유사한 프로젝트입니다.
  • H2O.ai 은 오픈 소스 데이터 과학 및 머신 러닝 플랫폼입니다.
  • KNIME자바로 구현된 머신 러닝 및 데이터 마이닝 소프트웨어입니다.
  • MOA(Massive Online Analysis)는 데이터 스트림의 대규모 채굴을 위한 오픈 소스 프로젝트로, 뉴질랜드 와이카토 대학에서도 개발되었습니다.
  • 뉴럴 디자이너는 C++로 작성된 딥러닝 기법을 기반으로 한 데이터 마이닝 소프트웨어입니다.
  • Orangescikit-learn을 기반으로 데이터 마이닝, 머신 러닝 및 시각화를 위한 유사한 오픈 소스 프로젝트입니다.
  • RapidMiner는 Weka를 통합한 Java로 구현된 상용 머신 러닝 프레임워크입니다.
  • scikit-learn은 파이썬에서 인기 있는 기계 학습 라이브러리입니다.

참고 항목

참고문헌

  1. ^ a b Witten, Ian H.; Frank, Eibe; Hall, Mark A.; Pal, Christopher J. (2011). "Data Mining: Practical machine learning tools and techniques, 3rd Edition". Morgan Kaufmann, San Francisco (CA). Retrieved 2011-01-19.
  2. ^ Holmes, Geoffrey; Donkin, Andrew; Witten, Ian H. (1994). "Weka: A machine learning workbench" (PDF). Proceedings of the Second Australia and New Zealand Conference on Intelligent Information Systems, Brisbane, Australia. Retrieved 2007-06-25.
  3. ^ Garner, Stephen R.; Cunningham, Sally Jo; Holmes, Geoffrey; Nevill-Manning, Craig G.; Witten, Ian H. (1995). "Applying a machine learning workbench: Experience with agricultural databases" (PDF). Proceedings of the Machine Learning in Practice Workshop, Machine Learning Conference, Tahoe City (CA), USA. pp. 14–21. Retrieved 2007-06-25.
  4. ^ "Weka Package Metadata". SourceForge. 2017. Retrieved 2017-11-11.
  5. ^ Reutemann, Peter; Pfahringer, Bernhard; Frank, Eibe (2004). "Proper: A Toolbox for Learning from Relational Data with Propositional and Multi-Instance Learners". 17th Australian Joint Conference on Artificial Intelligence (AI2004). Springer-Verlag. CiteSeerX 10.1.1.459.8443.
  6. ^ "weka-wiki - Packages". Retrieved 27 January 2020.
  7. ^ Witten, Ian H.; Frank, Eibe; Trigg, Len; Hall, Mark A.; Holmes, Geoffrey; Cunningham, Sally Jo (1999). "Weka: Practical Machine Learning Tools and Techniques with Java Implementations" (PDF). Proceedings of the ICONIP/ANZIIS/ANNES'99 Workshop on Emerging Knowledge Engineering and Connectionist-Based Information Systems. pp. 192–196. Retrieved 2007-06-26.
  8. ^ Piatetsky-Shapiro, Gregory I. (2005-06-28). "KDnuggets news on SIGKDD Service Award 2005". Retrieved 2007-06-25.
  9. ^ "Overview of SIGKDD Service Award winners". 2005. Retrieved 2007-06-25.
  10. ^ "Pentaho Acquires Weka Project". Pentaho. Retrieved 2018-02-06.
  11. ^ "Plugin for Machine Intelligence".
  12. ^ Thornton, Chris; Hutter, Frank; Hoos, Holger H.; Leyton-Brown, Kevin (2013). Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms. KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. pp. 847–855.

외부 링크