시멘틱 웹

Semantic Web

Web 3.0(Web3와 혼동하지 말 것)이라고도 하는 시맨틱 웹은 World Wide Web Consortium(W3C)에 의해 설정된 표준을 통해[1] World Wide Web을 확장한 것입니다.시맨틱 웹의 목적은 인터넷 데이터를 기계적으로 읽을 수 있게 만드는 것입니다.

데이터를 사용한 의미론 인코딩을 활성화하기 위해 RDF(Resource Description [2]Framework) 및 OWL([3]Web Ontology Language) 의 기술이 사용됩니다.이러한 기술은 메타데이터를 공식적으로 나타내기 위해 사용됩니다.를 들어, 온톨로지는 개념, 실체 간의 관계 및 사물의 범주를 설명할 수 있습니다.이러한 임베디드 시멘틱스는 데이터에 대한 추론 및 이종 데이터 [4]소스로 작동하는 것과 같은 중요한 이점을 제공합니다.

이러한 표준은 기본적으로 RDF인 웹에서 일반적인 데이터 형식 및 교환 프로토콜을 촉진합니다.W3C에 따르면 "Semantic Web은 애플리케이션,[5] 엔터프라이즈 및 커뮤니티 경계를 넘어 데이터를 공유하고 재사용할 수 있는 공통 프레임워크를 제공합니다."따라서 시맨틱 웹은 다양한 콘텐츠 및 정보 애플리케이션 및 시스템에 걸친 통합자로 간주됩니다.

이 용어는 Tim Berners-Lee가 기계에서 처리할[7] 수 있는 데이터 웹(또는 데이터 웹)[6]을 위해 만든 것입니다. 즉, 대부분의 의미를 기계에서 읽을 수 있는 웹입니다.그것의 비평가들은 그것의 실현 가능성에 의문을 제기하는 반면, 찬성론자들은 도서관, 정보과학, 산업, 생물학, 그리고 인문과학 연구에 대한 적용은 이미 원래의 [8]개념의 타당성을 증명했다고 주장한다.

Berners-Lee는 1999년에 시멘틱 웹에 대한 자신의 비전을 다음과 같이 표현했습니다.

저는 웹(컴퓨터가 웹상의 모든 데이터, 즉 사람과 컴퓨터 간의 콘텐츠, 링크 및 트랜잭션을 분석할 수 있게 되는 것)에 대한 꿈을 가지고 있습니다.이것을 가능하게 하는 「시맨틱 웹」은 아직 등장하지 않았지만, 등장하면, 통상, 관료주의, 우리의 일상 생활의 메카니즘은, 기계와 대화하는 기계로 처리된다.사람들이 오랫동안 외쳐온 '지능형 요원'들이 마침내 [9]실현될 것이다.

2001년 Berners-Lee, HendlerLassilaScientific American 기사는 기존 웹이 시멘틱 [10]웹으로 발전하는 것으로 예상되는 것을 묘사했다.2006년, Berners-Lee와 동료들은 다음과 같이 말했습니다. "이 단순한 아이디어는 대부분 실현되지 않은 채로 남아 있습니다."[11]2013년에는 400만 개 이상의 웹 도메인(총 약 2억 5천만 개 중)에 시멘틱 웹 [12]마크업이 포함되어 있었습니다.

다음 예에서는 웹사이트에 있는 "Paul Schuster be born in Dresden"이라는 텍스트에 주석을 달아 출생지와 사람을 연결합니다.다음 HTML fragment는 RDFa-syntax에서 schema.org 어휘와 Wikidata ID를 사용하여 작은 그래프가 어떻게 기술되고 있는지를 보여 줍니다.

<div vocab="https://schema.org/" type of="Person"> <span property="name"> Paul Schuster </span>는 <span property="birthPlace" type of="Place" href="https://schema.org/"> <span property="name">에서 태어났습니다.[드레스덴] </span></span> </div>
RDFa 예제에서 생성된 그래프

이 예에서는 Turtle 구문에 표시된 다음 5개의 트리플을 정의하고 있습니다.각 트리플은 결과 그래프에서 하나의 에지를 나타냅니다. 트리플의 첫 번째 요소(주제)는 에지가 시작되는 노드의 이름, 두 번째 요소(술어)는 에지의 유형, 마지막 및 세 번째 요소(개체)는 에지가 끝나는 노드의 이름 또는 리터럴 값(예를 들어 텍스트, 숫자 등).

배로 나누면 그림에 표시된 그래프가 나타납니다.

RDFa 예제에서 생성된 그래프, 웹의 추가 데이터로 풍부함

URI(Uniform Resource Identifier)를 사용하는 장점 중 하나는 HTTP 프로토콜을 사용하여 참조를 취소할 수 있다는 것입니다.이른바 Linked Open Data 원칙에 따르면 이러한 참조되지 않은 URI는 지정된 URI에 대한 추가 데이터를 제공하는 문서가 되어야 합니다.이 예에서는, 엣지와 노드의 양쪽 모두의 모든 URI(예:http://schema.org/Person,http://schema.org/birthPlace,http://www.wikidata.org/entity/Q1731)는 참조되지 않을 수 있으며, 예를 들어 드레스덴이 독일의 도시이거나 URI의 의미에서는 인물이 허구일 수 있다는 URI를 설명하는 추가 RDF 그래프가 생성됩니다.

두 번째 그래프는 이전 예제를 보여주지만, 이제 참조를 취소한 문서의 몇 가지 세 배로 강화되었습니다.https://schema.org/Person(녹색 가장자리) 및https://www.wikidata.org/entity/Q1731(파란색 가장자리).

관련 문서에서 명시적으로 주어진 모서리 외에도 모서리를 자동으로 추론할 수 있습니다. 즉, 트리플입니다.

원본 RDFa 조각과 트리플에서

에 있는 문서에서https://schema.org/Person(그림의 녹색 가장자리)는 주어진 OWL 의미론(두 번째 그림의 빨간색 점선)에 따라 다음과 같은 트리플을 추론할 수 있습니다.

배경

의미 네트워크 모델의 개념은 1960년대 초에 인지 과학자언어학자 앨런 M. 콜린스와 같은 연구자들에 의해 형성되었다.로스 퀼리언과 심리학자 엘리자베스 F. 의미론적으로 구조화된 지식을 나타내는 형태로서의 로프투스.현대 인터넷의 맥락에서 적용되면 페이지와 페이지 간의 상관관계에 대해 기계에서 읽을 수 있는 메타데이터를 삽입함으로써 하이퍼링크된 사람이 읽을 있는 웹 페이지 네트워크를 확장합니다.이를 통해 자동 에이전트는 보다 지능적으로 웹에 액세스하고 사용자를 대신하여 더 많은 태스크를 수행할 수 있습니다."Semantic Web"이라는 용어는 World Wide Web의 발명자이자 제안된 시맨틱 웹 표준의 개발을 감독하는 World Wide Web Consortium("W3C")의 이사인 [7]Tim Berners-Lee에 의해 만들어졌습니다.그는 시멘틱 웹을 "머신에 의해 직간접적으로 처리될 수 있는 데이터의 웹"이라고 정의합니다.

W3C가 제안한 많은 기술들은 W3C 산하에 놓이기 전에 이미 존재했다.이는 다양한 맥락에서 사용됩니다. 특히 한정된 정의 도메인을 포함하는 정보를 다루는 경우, 그리고 과학적 연구나 기업 간의 데이터 교환 등 데이터 공유가 공통적으로 필요한 경우입니다.또한 마이크로포맷과 같은 유사한 목표를 가진 다른 기술도 등장했다.

HTML의 제한

일반적인 컴퓨터의 많은 파일은 사람이 읽을 수 있는 문서와 기계에서 읽을 수 있는 데이터로 느슨하게 나눌 수도 있습니다.메일 메시지, 보고서, 브로셔와 같은 문서는 사람에 의해 읽힌다.달력, 주소록, 재생 목록 및 스프레드시트와 같은 데이터는 보기, 검색 및 결합할 수 있는 응용 프로그램을 사용하여 표시됩니다.

현재 월드와이드웹은 주로 하이퍼텍스트 마크업 언어(HTML)로 작성된 문서에 기초하고 있습니다.HTML은 이미지나 인터랙티브 형식과 같은 멀티미디어 객체가 포함된 텍스트 본문을 코딩하는 데 사용됩니다.메타데이터 태그는 컴퓨터가 웹 페이지의 내용을 분류하는 방법을 제공합니다.아래 예에서 필드 이름 "키워드", "설명" 및 "작성자"에는 "컴퓨팅" 및 "판매용 값싼 위젯" 및 "존 도우"와 같은 값이 할당됩니다.

< >메타 이름.="실패" 내용="외국어, 컴퓨터 공부, 컴퓨터" /> < >메타 이름.="설명" 내용="저가 위젯 판매" /> < >메타 이름.='작성자' 내용="존 도우" /> 

이러한 메타데이터 태그 부착 및 분류로 인해 이 데이터에 액세스하여 공유하려는 다른 컴퓨터 시스템이 관련 값을 쉽게 식별할 수 있습니다.

HTML과 렌더링 도구( 브라우저 소프트웨어나 다른 사용자 에이전트 등)를 사용하면 판매용 아이템을 나열하는 페이지를 생성하여 표시할 수 있습니다.이 카탈로그 페이지의 HTML은 "이 문서의 제목은 '위젯 슈퍼스토어'입니다"와 같은 간단한 문서 수준의 어설션을 할 수 있지만, HTML 자체에서는 예를 들어 아이템 번호 X586172가 소매 가격이 €199인 Acme Gizmo이거나 소비자용 제품임을 명확하게 단언할 수 있는 기능은 없습니다.HTML 에서는, 텍스트 「X586172」의 스팬은 「Acme Gizmo」나 「€199」등의 근처에 배치할 필요가 있다고 밖에 말할 수 없습니다.「이것은 카탈로그입니다」라고 말할 수도 없고, 「Acme Gizmo」가 타이틀의 일종이거나 「€199」가 가격이라고 말할 수도 없습니다.또한 이 정보들이 페이지에 나열될 수 있는 다른 항목과 구별되는 개별 항목을 설명할 때 함께 결합되어 있다는 것을 표현할 방법도 없습니다.

시멘틱 HTML은 레이아웃 세부사항을 직접 지정하는 것이 아니라 의도를 따르는 기존의 HTML 관행을 말합니다.예를 들면,<em>보다 오히려 '경계'를 나타내는 모습<i>이탤릭체를 지정합니다.레이아웃 세부 사항은 캐스케이드 스타일 시트와 함께 브라우저에 맡겨집니다.그러나 이 관행은 판매 품목이나 가격과 같은 객체의 의미를 규정하는 데 미달한다.

마이크로포맷은 HTML 구문을 확장하여 사람, 조직, 이벤트 및 [13]제품을 포함한 개체에 대해 기계에서 읽을 수 있는 의미 마크업을 만듭니다.유사한 이니셔티브로는 RDFa, Microdata, Schema.org 등이 있습니다.

시맨틱 웹 솔루션

Semantic Web은 솔루션을 더욱 발전시킵니다.데이터용으로 특별히 설계된 언어로 게시하는 작업도 포함됩니다.RDF(Resource Description Framework), Web Ontology Language(OWL) 및 Extensible Markup Language(XML). HTML은 문서와 문서 간의 링크를 설명합니다.반면 RDF, OWL 및 XML은 사람, 회의, 비행기 부품 등 임의의 것을 기술할 수 있습니다.

이러한 기술은 웹 문서의 내용을 보완하거나 대체하기 위해 결합됩니다.따라서 콘텐츠는 웹 액세스 [14]가능한 데이터베이스에 저장된 기술 데이터 또는 문서 내의 마크업(특히 XML이 포함된 Extensible HTML(XHTML) 또는 레이아웃 또는 렌더링 큐가 별도로 저장된 순수 XML)으로 나타날 수 있습니다.기계에서 읽을 수 있는 설명을 통해 콘텐츠 관리자는 콘텐츠에 의미를 부여할 수 있습니다. 즉, 콘텐츠에 대한 지식 구조를 설명할 수 있습니다.이와 같이 기계는 텍스트 대신 인간의 연역적 추론 및 추론과 유사한 과정을 사용하여 지식 자체를 처리할 수 있으며, 따라서 더 의미 있는 결과를 얻고 컴퓨터가 자동화된 정보 수집과 연구를 수행하도록 도울 수 있다.

의미 없는 웹 페이지에서 사용되는 태그의 예:

<item> 삭제 </item>

시멘틱 Web 페이지에서 유사한 정보를 부호화하는 방법은 다음과 같습니다.

<항목 rdf:about="https://example.org/semantic-web/"> Semantic Web </item>

Tim Berners-Lee는 HTML 기반의 월드 와이드 웹과는 대조적으로 Linked Data의 결과 네트워크를 Giant Global Graph라고 부릅니다.Berners-Lee는 과거가 문서 공유였다면 미래는 데이터 공유라고 가정합니다."어떻게"라는 질문에 대한 그의 대답은 세 가지 지침을 제공한다.첫째, URL이 데이터를 가리켜야 합니다.둘째, URL에 접속하는 사람은 누구나 데이터를 돌려받을 수 있습니다.셋째, 데이터 내의 관계는 데이터가 포함된 추가 URL을 가리켜야 합니다.

태그 및 식별자

계층적 범주 및 공동으로 추가 및 유지되는 태그(예: 포크노믹스와 함께)를 포함한 태그는 의미적 웹 [15][16][17]비전에 대한 잠재적 사용 또는 단계로 간주할 수 있다.

계층 카테고리와 협업으로 추가된 카테고리, 분석 도구(scite.ai 알고리즘 [18]등) 및 메타데이터(태그 포함)를 포함한 고유 식별자를 사용하여 시맨틱 웹의 형태를 작성할 수 있습니다.시맨틱 웹은 어느 정도 시맨틱한 웹입니다.특히 개발 중인 OpenAlex,[19][20][21] WikidataScholia 프로젝트의 연구 주제 및 과학 분야에 의한 과학 연구 구조화에 사용되며 다양한 의미 쿼리를 위한 API, 웹 페이지, 피드 및 그래프를 제공한다.

Web 3.0

시멘틱 웹

Tim Berners-Lee는 시맨틱 웹을 Web 3.0의 [22]컴포넌트라고 설명했습니다.

사람들이 웹 3.0이 뭐냐고 계속 물어봐요.Web 2.0에 확장 가능한 벡터 그래픽스(물결치는 것, 접히는 것, 뿌옇게 보이는 것)를 오버레이 해, 방대한 데이터 공간에 통합된 시맨틱 Web에 액세스 하면, 믿을 수 없는 데이터·리소스에 액세스 할 수 있다고 생각합니다.

--

"Semantic Web"은 "Web 3.0"[23]의 동의어로 사용되기도 합니다.단, 각 용어의 정의는 다릅니다.

과제들

시맨틱 웹의 과제 중 일부는 광대함, 모호함, 불확실성, 불일치 및 기만이다.자동화된 추론 시스템은 시맨틱 웹의 가능성을 실현하기 위해 이러한 모든 문제를 처리해야 합니다.

  • 광활함:월드 와이드 웹은 수십억 개의 페이지를 포함하고 있다.SNOMED CT 의학용어 온톨로지만 해도 370,000개의 클래스 이름을 포함하고 있으며, 기존 기술로는 의미론적으로 중복된 용어를 모두 제거할 수 없었습니다.자동화된 추리 시스템은 정말 엄청난 양의 입력을 처리해야 합니다.
  • 애매함:'젊음'이나 '키 큰'과 같은 부정확한 개념입니다.이는 사용자 쿼리의 모호성, 콘텐츠 공급자가 나타내는 개념, 공급자 용어와 쿼리 용어를 일치시키고 서로 다른 놀리지 베이스를 겹치지만 미묘하게 다른 개념으로 결합하려는 시도에서 발생합니다.애매모호한 논리는 애매모호함을 다루기 위한 가장 일반적인 기법이다.
  • 불확실성:이것들은 값이 불확실한 정확한 개념이다.예를 들어, 환자는 각각 다른 확률로 여러 개별 진단에 해당하는 일련의 증상을 나타낼 수 있다.확률론적 추론 기법은 일반적으로 불확실성을 다루기 위해 사용된다.
  • 불일치:이는 대규모 온톨로지의 개발 및 별도의 소스의 온톨로지가 결합될 때 필연적으로 발생하는 논리적 모순입니다.연역적 추론은 모순에 직면했을 때 비극적으로 실패한다.왜냐하면 "어떤 것이든 모순에서 비롯되기 때문이다.변명의 여지가 있는 추론과 모순된 추론은 모순을 다루기 위해 사용할 수 있는 두 가지 기술이다.
  • 기만: 이것은 정보의 생산자가 의도적으로 정보의 소비자를 오도하고 있는 경우입니다.현재 이 위협을 완화하기 위해 암호화 기술이 사용되고 있습니다.그러나 정보를 생산하거나 공표한 기업의 정체성과 관련된 정보를 포함하여 정보의 무결성을 결정하는 수단을 제공함으로써, 잠재적 기만의 경우 신뢰성 문제를 다루어야 한다.

이 과제 목록은 완전한 것이 아니라 설명이며, 시맨틱 웹의 "통합 논리" 및 "증명" 계층에 대한 과제에 초점을 맞추고 있습니다.World Wide Web Consortium (W3C) Incubator Group for Unfincity For the World Wide[24] Web (URW3-XG) 최종 보고서는 이러한 문제를 "불확실성"[25]이라는 단일 제목으로 묶습니다.여기서 설명하는 많은 기술은 조건부 확률에 주석을 달기 위해 Web Ontology Language(OWL)의 확장이 필요합니다.이것은 활발한 [26]연구 분야입니다.

표준

Web 3.0 의 컨텍스트에서의 시멘틱 Web 의 표준화는, W3C [27]에 의해서 관리되고 있습니다.

구성 요소들

"Semantic Web"이라는 용어는 종종 [5]이를 가능하게 하는 형식과 기술을 지칭하기 위해 더 구체적으로 사용됩니다.링크된 데이터의 수집, 구조화 및 복구는 특정 지식 도메인 내의 개념, 용어 및 관계에 대한 공식적인 설명을 제공하는 기술을 통해 가능합니다.이러한 테크놀로지는 W3C 표준으로 지정되어 있으며, 다음과 같은 것이 있습니다.

  • 정보를 기술하는 일반적인 방법인 Resource Description Framework(RDF)
  • RDF 스키마(RDFS)
  • 단순 지식 조직 시스템(SKOS)
  • SPARQL, RDF 쿼리 언어
  • 사람의 가독성을 고려하여 설계된 표기법 3(N3)
  • 데이터 저장 및 전송 형식인 N-Triples
  • 터틀(용어 RDF 삼중언어)
  • Web Ontology Language(OWL), 지식 표현 언어 패밀리
  • Rule Interchange Format(RIF; 규칙 교환 형식)은 웹에서 규칙 교환을 지원하는 웹 규칙 언어 방언의 프레임워크입니다.
  • 데이터를 기술하는 JSON 기반의 메서드인 Linked Data용 JavaScript Object Notation(JSON-LD; JavaScript 객체 표기법
  • ActivityPub은 클라이언트와 서버가 서로 통신하는 일반적인 방법입니다.이것은 인기 있는 분산형 소셜 네트워크 Mastodon에서 사용됩니다.

시맨틱스택은 시맨틱 웹의 아키텍처를 나타냅니다.구성 요소의 기능과 관계는 다음과 [28]같이 요약할 수 있습니다.

  • XML은 문서 내의 내용 구조에 대한 기본 구문을 제공하지만, 의미론은 포함된 내용의 의미와 관련이 없습니다.XML은 현재 대부분의 경우 Turtle과 같은 대체 구문이 존재하기 때문에 시멘틱 웹 테크놀로지의 필수 컴포넌트가 아닙니다.거북이는 사실상의 표준이지만 공식적인 표준화 과정을 거치지 않았다.
  • XML Schema는 XML 문서에 포함된 요소의 구조와 내용을 제공하고 제한하기 위한 언어입니다.
  • RDF는 객체(" 리소스")와 그 관계를 나타내는 데이터 모델을 표현하기 위한 간단한 언어입니다.RDF 기반 모델은 RDF/XML, N3, Turtle 및 RDFa 등 다양한 구문으로 나타낼 수 있습니다.RDF는 시맨틱 [29][30]웹의 기본 표준입니다.
  • RDF Schema는 RDF를 확장하며 RDF 기반 리소스의 속성 및 클래스를 설명하는 어휘로, 이러한 속성 및 클래스의 일반 계층에 대한 의미론을 포함합니다.
  • OWL은 속성 및 클래스를 기술하기 위한 더 많은 어휘를 추가합니다. 그 중에서도 클래스 간 관계(예: 불연속성), 카디널리티(예: "정확한 1", 동등성, 풍부한 속성 타이핑, 속성 특성(예: 대칭성) 및 열거된 클래스입니다.
  • SPARQL은 시맨틱 웹 데이터 소스의 프로토콜 및 쿼리 언어입니다.
  • RIF는 W3C 규칙 교환 형식입니다.컴퓨터가 실행할 수 있는 웹 규칙을 표현하기 위한 XML 언어입니다.RIF는 방언이라고 불리는 여러 버전을 제공합니다.여기에는 RIF Basic Logic Language(RIF-BLD)와 RIF Production Rules Language(RIF PRD)가 포함됩니다.

표준화 현황

확립된 표준:

아직 완전히 실현되지 않음:

  • 로직 레이어와 프루프 레이어 통합
  • 시멘틱규칙 언어(SWRL)

적용들

그 목적은 다음과 같은 의미적서비스를 만들어 웹과 상호 연결된 리소스의 유용성과 유용성을 향상시키는 것입니다.

  • RDF 및 SPARQL 표준을 사용하여 기존 데이터 시스템을 공개하는 서버.다양한 애플리케이션에서 [31]RDF로 변환하는 많은 것들이 존재합니다.관계형 데이터베이스는 중요한 소스입니다.시맨틱서버는 동작에 영향을 주지 않고 기존 시스템에 연결됩니다.
  • 의미 정보가 포함된 문서(HTML의 확장자)<meta> 크롤러를 사용하는 웹 검색 엔진에 대한 정보를 제공하기 위해 오늘날 웹 페이지에 사용되는 태그).이는 문서 작성자, 제목, 설명 등 인간이 이해할 수 있는 내용에 대한 기계적인 정보일 수도 있고 일련의 사실을 나타내는 순수 메타데이터일 수도 있습니다(사이트의 자원 및 서비스 등).Uniform Resource Identifier(URI; 통일 자원 식별자)로 식별할 수 있는 것은 무엇이든 기술할 수 있으므로 의미 웹은 동물, 사람, 장소, 아이디어 등에 대해 추론할 수 있습니다.HTML 문서에서 사용할 수 있는 시맨틱 주석 형식은 Microformat, RDFa, Microdata 및 JSON-LD[32]4가지입니다.시멘틱 마크업은 수동이 아닌 자동으로 생성되는 경우가 많습니다.
  • 문서 작성자가 제공된 메타데이터의 정보를 사용할 수 있도록 문서 작성자가 문서를 표시하는 방법을 알 수 있도록 하는 공통 메타데이터 용어(ontologies) 및 어휘 간 맵('페이지 작성자'의 의미에서의 작성자와 서적 리뷰의 대상이 되는 책의 의미에서의 작성자가 혼동되지 않도록 함)).
  • 이 데이터를 사용하여 시맨틱 웹 사용자를 위한 태스크를 수행하는 자동화된 에이전트입니다.
  • 의미 번역
  • 웹 기반 서비스(종종 자체 에이전트와 함께)를 통해 에이전트에게 특정 정보를 제공합니다. 예를 들어, 일부 온라인 상점에 불량 서비스 또는 스팸 이력이 있는지 묻는 신뢰할 수 있는 서비스입니다.

이러한 서비스는 공공 검색 엔진에 유용하거나 조직 내 지식 관리에 사용될 수 있습니다.비즈니스 애플리케이션에는 다음이 포함됩니다.

  • 혼합[33] 소스로부터의 정보 통합 촉진
  • 기업 용어의 모호성 해소
  • 정보 검색을 개선하여 정보 과부하를 줄이고 검색된 데이터의[34][35][36][37] 정밀도와 정밀도를 높입니다.
  • 특정[38] 도메인에 대한 관련 정보 식별
  • 의사결정 지원 제공

기업에는 폐쇄적인 사용자 그룹이 있으며 경영진은 특정 온톨로지 채택 및 시멘틱 주석 사용 의 회사 지침을 적용할 수 있습니다.Semantic Web에 비해 확장에 관한 요건은 적고 기업 내에서 유통되는 정보는 일반적으로 신뢰성이 높아집니다.고객 데이터 처리 이외의 문제는 프라이버시입니다.

회의적인 반응

실현 가능성

비평가들은 시맨틱 웹의 완전 또는 부분적인 구현의 기본적인 실현 가능성에 의문을 제기하며, 시맨틱 웹을 설정하는 어려움과 필요한 노력이 투자되는 것을 방해하는 범용적 유용성의 부족을 지적하고 있다.2003년 논문에서 Marshall과 Shipman은 기존의 웹 하이퍼텍스트 [39]제작과 비교하여 지식을 공식화하는 데 내재된 인지적 오버헤드를 지적했습니다.

HTML의 기본을 배우는 것은 비교적 간단하지만 지식 표현 언어나 도구를 배우는 것은 저자가 표현의 추상화 방법과 추론에 미치는 영향에 대해 배울 필요가 있다.예를 들어 클래스-인스턴스 관계 또는 슈퍼클래스-서브클래스 관계를 이해하는 것은 하나의 개념이 다른 개념의 "유형"이라는 것을 이해하는 것 이상입니다.[…] 이러한 추상화는 컴퓨터 과학자와 지식 엔지니어에게 특별히 가르쳐지지만, "일종의" 어떤 존재라는 유사한 자연어 의미와는 일치하지 않습니다.이러한 공식 표현을 효과적으로 사용하려면 작성자가 도메인에 필요한 다른 기술과 더불어 숙련된 지식 엔지니어가 되어야 합니다.[…] 정식 표현 언어를 배운 후에도, 그 표현으로 아이디어를 표현하는 것이 덜 형식적인 표현보다 훨씬 더 많은 노력을 기울이는 경우가 많습니다.실제로, 이것은 의미 데이터의 선언에 기초한 프로그래밍의 한 형태이며, 추론 알고리즘이 작성된 구조를 어떻게 해석할 것인지에 대한 이해를 필요로 한다.

Marshall과 Shipman에 따르면 많은 지식의 암묵적이고 변화하는 특성은 지식 엔지니어링 문제를 가중시키고 시맨틱 웹의 특정 영역에 대한 적용 가능성을 제한합니다.그들이 지적하는 또 다른 문제는 지식을 표현하는 도메인 또는 조직 고유의 방법이며, 이는 기술적 수단뿐만 아니라 [39]지역사회 합의를 통해 해결되어야 한다.알고 보니 사내 프로젝트의 전문 커뮤니티나 조직은 주변 커뮤니티나 덜 [40]전문화된 커뮤니티보다 더 큰 의미 웹 기술을 채택하는 경향이 있었습니다.도메인이나 범위가 일반 대중이나 World-Wide [40]Web보다 더 제한적인 곳에서는 채택을 위한 실질적인 제약이 덜 어려워 보입니다.

마지막으로, Marshall과 Shipman은 (Knowledge Navigator 스타일의) 인텔리전트 에이전트가 주로 수동으로 큐레이션된 시멘틱 [39]웹에서 작업한다는 개념에서 실용적인 문제를 발견합니다.

사용자의 요구가 알려져 분산된 정보자원이 잘 기술되어 있는 상황에서는 이 접근방식이 매우 효과적일 수 있습니다.예상치 못한 상황에서 예상치 못한 정보자원을 하나로 묶는 상황에서는 Google 접근방식이 더욱 강력합니다.더욱이, 시맨틱 웹은 더 취약한 추론 체인에 의존한다. 체인의 누락된 요소는 원하는 행동을 수행하는 데 실패하는 결과를 초래하는 반면, 인간은 구글과 같은 접근 방식으로 누락된 조각을 제공할 수 있다.[…] 비용 대비 효과의 트레이드오프는 합리적으로 잘 구조화된 도메인 고유의 정보 자원을 조합하기 위해 특별히 작성된 시멘틱 웹 메타데이터에 유리하게 작용할 수 있습니다.이러한 정보 자원을 성공시키기 위해서는 사용자/고객의 요구에 대한 세심한 주의가 이러한 연합을 촉진할 것입니다.

Cory Doctorow의 비평("메타랩")은 인간의 행동과 개인적 선호의 관점에서 나온 것이다.예를 들어, 사람들은 메타데이터의 진실성을 순진하게 가정하는 시맨틱 웹 엔진을 오도하기 위해 가짜 메타데이터를 웹 페이지에 포함할 수 있습니다.이 현상은 Altavista 순위 알고리즘을 속여 특정 웹 페이지의 순위를 끌어올리는 메타태그와 함께 잘 알려져 있다: 구글 색인 엔진은 이러한 조작 시도를 특별히 찾는다.Peter GérdenforsTimo Honkela는 논리 기반의 시멘틱 웹 기술은 [41][42]의미론과 관련된 관련 현상의 극히 일부만을 포괄한다고 지적한다.

검열과 프라이버시

시맨틱 웹에 대한 열정은 검열과 사생활에 대한 우려로 누그러질 수 있다.예를 들어, 텍스트 분석 기술은 다른 단어, 예를 들어 은유 또는 단어 대신 이미지를 사용하여 쉽게 우회할 수 있습니다.시맨틱 웹의 선진적인 구현은 정부가 온라인 정보의 표시와 생성을 제어하는 것을 훨씬 더 쉽게 할 것이다. 왜냐하면 이 정보는 자동화된 콘텐츠 차단 기계가 훨씬 더 쉽게 이해할 수 있기 때문이다.게다가 FOAF 파일이나 지리 위치 메타데이터를 사용하면, 개인 블로그등의 기사의 작성에 관한 익명성이 거의 없어질 것이라는 문제도 제기되어 왔다.이러한 우려 사항 중 일부는 "정책 인식 웹" 프로젝트에서[43] 다루어졌으며 활발한 연구 개발 주제입니다.

출력 포맷의 2배

시맨틱 웹에 대한 또 다른 비판은 콘텐츠 작성 및 공개에 시간이 많이 걸린다는 것입니다.이는 하나의 데이터에는 두 가지 형식이 필요하기 때문입니다.하나는 사람 보기용이고 다른 하나는 기계용입니다.그러나 개발 중인 많은 웹 애플리케이션은 데이터를 게시하거나 이러한 데이터에 대한 머신의 요청에 따라 머신이 읽을 수 있는 포맷을 생성하여 이 문제를 해결하고 있습니다.마이크로포맷의 개발은 이런 종류의 비판에 대한 하나의 반응이었다.시맨틱 웹의 실현 가능성을 옹호하는 또 다른 주장은 아마존의 메카니컬 [citation needed]터크와 같은 디지털 노동 시장에서 인간 지능 태스크의 가격이 하락할 가능성이 있다는 것이다.

eRDF 및 RDFa 등의 사양에서는 임의의 RDF 데이터를 HTML 페이지에 삽입할 수 있습니다.GRDDL(Gleaning Resource Descriptions from Language) 메커니즘에서는 기존 자료(마이크로포맷 포함)를 RDF로 자동 해석할 수 있으므로 퍼블리셔는 HTML과 같은 단일 형식만 사용하면 됩니다.

기업 응용 프로그램에 대한 연구 활동

기업 시맨틱 웹에 초점을 맞춘 최초의 연구 그룹은 2002년에 설립된 INRIA-Sophia-Antipolis의 ACACIA 팀입니다.이들의 연구 성과로는 RDF(S) 기반[44] Corese 검색 엔진과 지식 관리(예: 기업 시맨틱 웹을 위한 온톨로지 및 멀티 에이전트 시스템) 및 e-러닝[46]위한 분산 인공지능 영역에서의 시맨틱 웹 기술 적용 등이 있다.

2008년 이후 베를린 자유대학에 있는 기업 시멘틱 웹 연구 그룹은 다음과 같은 구성 요소에 초점을 맞추고 있습니다.기업 시맨틱 검색, 기업 시맨틱 콜라보레이션 및 기업 온톨로지 엔지니어링.[47]

온톨로지 엔지니어링 연구에는 전문이 아닌 사용자가 온톨로지 및 의미론적으로 주석이[48] 달린 콘텐츠를 만들고 기업 내 사용자의 상호작용에서 명시적 지식을 추출하는 방법에 대한 질문이 포함됩니다.

응용 프로그램의 미래

Web 2.0이라는 용어를 만든 Tim O'Reilly는 시맨틱 웹을 데이터의 웹으로 하는 장기적인 비전을 제안했습니다.이것에 의해, 고도의 애플리케이션이 데이터 [49]웹을 조작할 수 있습니다.데이터 웹은 월드 와이드 웹을 분산 파일 시스템에서 분산 데이터베이스 시스템으로 [50]변환합니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ W3C 시맨틱 웹: https://www.w3.org/standards/semanticweb/
  2. ^ "World Wide Web Consortium (W3C), "RDF/XML Syntax Specification (Revised)", 25 Feb. 2014".
  3. ^ "World Wide Web Consortium (W3C), "OWL Web Ontology Language Overview", W3C Recommendation, 10 Feb. 2004".
  4. ^ Chung, Seung-Hwa (2018). "The MOUSE approach: Mapping Ontologies using UML for System Engineers". Computer Reviews Journal: 8–29. ISSN 2581-6640.
  5. ^ a b "W3C Semantic Web Activity". World Wide Web Consortium (W3C). November 7, 2011. Retrieved November 26, 2011.
  6. ^ "Q&A with Tim Berners-Lee, Special Report". businessweek.com. Retrieved 14 April 2018.
  7. ^ a b Berners-Lee, Tim; James Hendler; Ora Lassila (May 17, 2001). "The Semantic Web". Scientific American. Retrieved July 2, 2019.
  8. ^ Lee Feigenbaum (May 1, 2007). "The Semantic Web in Action". Scientific American. Retrieved February 24, 2010.
  9. ^ Berners-Lee, Tim; Fischetti, Mark (1999). Weaving the Web. HarperSanFrancisco. chapter 12. ISBN 978-0-06-251587-2.
  10. ^ Berners-Lee, Tim (May 17, 2001). "The Semantic Web" (PDF). Scientific American. S2CID 32015696. Archived from the original (PDF) on October 10, 2017. Retrieved March 13, 2008.
  11. ^ Nigel Shadbolt; Wendy Hall; Tim Berners-Lee (2006). "The Semantic Web Revisited" (PDF). IEEE Intelligent Systems. Retrieved April 13, 2007.
  12. ^ Ramanathan V. Guha (2013). "Light at the End of the Tunnel". International Semantic Web Conference 2013 Keynote. Retrieved March 8, 2015.
  13. ^ Allsopp, John (March 2007). Microformats: Empowering Your Markup for Web 2.0. Friends of ED. p. 368. ISBN 978-1-59059-814-6.
  14. ^ Artem Chebotko와 Shiyong Lu, "Quering the Semantic Web: A Efficient Access Using Relational Databases", LAP Lambert Academic Publishing, ISBN 978-3-8383-0264-5, 2009.
  15. ^ "Towards the Semantic Web: Collaborative Tag Suggestions" (PDF).
  16. ^ Specia, Lucia; Motta, Enrico (2007). "Integrating Folksonomies with the Semantic Web". The Semantic Web: Research and Applications. Springer: 624–639. doi:10.1007/978-3-540-72667-8_44.
  17. ^ "Bridging the gap between folksonomies and the semantic web: an experience report" (PDF).
  18. ^ Nicholson, Josh M.; Mordaunt, Milo; Lopez, Patrice; Uppala, Ashish; Rosati, Domenic; Rodrigues, Neves P.; Grabitz, Peter; Rife, Sean C. (5 November 2021). "scite: A smart citation index that displays the context of citations and classifies their intent using deep learning". Quantitative Science Studies. 2 (3): 882–898. doi:10.1162/qss_a_00146.
  19. ^ Singh Chawla, Dalmeet (24 January 2022). "Massive open index of scholarly papers launches". Nature. doi:10.1038/d41586-022-00138-y. Retrieved 14 February 2022.
  20. ^ "OpenAlex: The Promising Alternative to Microsoft Academic Graph". Singapore Management University (SMU). Retrieved 14 February 2022.
  21. ^ "OpenAlex Documentation". Retrieved 18 February 2022.
  22. ^ Shannon, Victoria (23 May 2006). "A 'more revolutionary' Web". International Herald Tribune. Retrieved 26 June 2006.
  23. ^ Sharma, Akhilesh. "Introducing The Concept Of Web 3.0". Tweak And Trick. Retrieved 10 January 2017.
  24. ^ "W3C Uncertainty Reasoning for the World Wide Web". www.w3.org. Retrieved 2021-05-14.
  25. ^ "Uncertainty Reasoning for the World Wide Web". W3.org. Retrieved 20 December 2018.
  26. ^ Lukasiewicz, Thomas; Umberto Straccia (2008). "Managing uncertainty and vagueness in description logics for the Semantic Web" (PDF). Web Semantics: Science, Services and Agents on the World Wide Web. 6 (4): 291–308. doi:10.1016/j.websem.2008.04.001.
  27. ^ "Semantic Web Standards". W3.org. Retrieved 14 April 2018.
  28. ^ "OWL Web Ontology Language Overview". World Wide Web Consortium (W3C). February 10, 2004. Retrieved November 26, 2011.
  29. ^ "Resource Description Framework (RDF)". World Wide Web Consortium.
  30. ^ Allemang, Dean; Hendler, James; Gandon, Fabien (August 3, 2020). Semantic Web for the Working Ontologist : Effective Modeling for Linked Data, RDFS, and OWL (Third ed.). [New York, NY, USA]: ACM Books; 3rd edition. ISBN 978-1450376143.
  31. ^ "ConverterToRdf - W3C Wiki". W3.org. Retrieved 20 December 2018.
  32. ^ Sikos, Leslie F. (2015). Mastering Structured Data on the Semantic Web: From HTML5 Microdata to Linked Open Data. Apress. p. 23. ISBN 978-1-4842-1049-9.
  33. ^ Zhang, Chuanrong; Zhao, Tian; Li, Weidong (2015). Geospatial Semantic Web. Springer International Publishing : Imprint: Springer. ISBN 978-3-319-17801-1.
  34. ^ 오마르 알론소와 휴고 사라고사.2008. 정보 검색 시 의미 주석 활용: ESAIR '08. SIGIR Forum 42, 1(2008년 6월), 55-58. doi:10.1145/1394251.1394262
  35. ^ 야프 캄프스, 유시 칼그렌, 랄프 셴켈, 2011년.정보 검색(ESAIR)에서 의미 주석 활용에 관한 제3차 워크숍 보고서.SIGIR 포럼 45, 1 (2011년 5월), 33 ~41.doi:10.1145/1988852.1988858
  36. ^ 야프 캄프스, 유시 칼그렌, 피터 미카, 바네사 머독, 2012년.정보 검색에서 의미 주석 활용에 관한 다섯 번째 워크숍: ESAIR '12).제21회 ACM 국제정보 및 지식관리에 관한 회의(CIKM '12).ACM, 뉴욕, 뉴욕, 미국, 2772~2773.doi:10.1145/2396761.2398761
  37. ^ 오마르 알론소, 자프 캄프스, 유시 칼그렌, 2015년.제7회 정보 검색 시 의미 주석 활용 워크숍 보고서(ESAIR '14).SIGIR 포럼 49, 1 (2015년 6월), 27-34.doi:10.1145/2795403.2795412
  38. ^ Kuriakose, John (September 2009). "Understanding and Adopting Semantic Web Technology". Cutter IT Journal. CUTTER INFORMATION CORP. 22 (9): 10–18.
  39. ^ a b c Marshall, Catherine C.; Shipman, Frank M. (2003). Which semantic web? (PDF). Proc. ACM Conf. on Hypertext and Hypermedia. pp. 57–66.
  40. ^ a b Ivan Herman (2007). State of the Semantic Web (PDF). Semantic Days 2007. Retrieved July 26, 2007.
  41. ^ Gärdenfors, Peter (2004). How to make the Semantic Web more semantic. Formal Ontology in Information Systems: proceedings of the third international conference (FOIS-2004). IOS Press. pp. 17–34.
  42. ^ Honkela, Timo; Könönen, Ville; Lindh-Knuutila, Tiina; Paukkeri, Mari-Sanna (2008). "Simulating processes of concept formation and communication". Journal of Economic Methodology. 15 (3): 245–259. doi:10.1080/13501780802321350. S2CID 16994027.
  43. ^ "Policy Aware Web Project". Policyawareweb.org. Retrieved 2013-06-14.
  44. ^ Corby, Olivier; Dieng-Kuntz, Rose; Zucker, Catherine Faron; Gandon, Fabien (2006). "Searching the Semantic Web: Approximate Query Processing based on Ontologies". IEEE Intelligent Systems. 21: 20–27. doi:10.1109/MIS.2006.16. S2CID 11488848.
  45. ^ Gandon, Fabien (7 November 2002). Distributed Artificial Intelligence And Knowledge Management: Ontologies And Multi-Agent Systems For A Corporate Semantic Web (phdthesis). Université Nice Sophia Antipolis.
  46. ^ Buffa, Michel; Dehors, Sylvain; Faron-Zucker, Catherine; Sander, Peter (2005). "Towards a Corporate Semantic Web Approach in Designing Learning Systems: Review of the Trial Solutioins Project" (PDF). International Workshop on Applications of Semantic Web Technologies for E-Learning. Amsterdam, Holland. pp. 73–76.
  47. ^ "Corporate Semantic Web - Home". Corporate-semantic-web.de. Retrieved 14 April 2018.
  48. ^ Hinze, Annika; Heese, Ralf; Luczak-Rösch, Markus; Paschke, Adrian (2012). "Semantic Enrichment by Non-Experts: Usability of Manual Annotation Tools" (PDF). ISWC'12 - Proceedings of the 11th international conference on The Semantic Web. Boston, USA. pp. 165–181.
  49. ^ Mathieson, S. A. (6 April 2006). "Spread the word, and join it up". The Guardian. Retrieved 14 April 2018.
  50. ^ Spivack, Nova (18 September 2007). "The Semantic Web, Collective Intelligence and Hyperdata". novaspivack.typepad.com/nova_spivacks_weblog [This Blog has Moved to NovaSpivack.com]. Retrieved 14 April 2018.

추가 정보

외부 링크