Procesamient o de Lenguaje Natural con Python: COMPUTADORAS
Por Ajit Singh
()
Información de este libro electrónico
Este libro tiene como objetivo presentar las técnicas fundamentales del procesamiento del lenguaje natural, desarrollar una comprensión de los límites de esas técnicas y de los temas de investigación actuales, y evaluar algunas aplicaciones actuales y potenciales.
● 1. Introducción. Breve historia de la investigación de la PNL, aplicaciones actuales, arquitectura genérica del sistema de la PNL, enfoques basados en el conocimiento versus enfoques probabilísticos.
●2. Técnicas de estados finitos. En morfología seccional y derivacional, autómatas de estado finito en PNL, transductores de estado finito.
●3. Predicción y etiquetado de partes del discurso. Corpora, DIY Corpus, Corpus Análisis, N-gramas simples, predicción de palabras, etiquetado estocástico y evaluación del rendimiento del sistema.
●4. Análisis y generación. Gramática generativa, gramáticas libres de contexto, parsing y generación con gramáticas libres de contexto, pesos y probabilidades. Gramática basada en restricciones, unificación, semántica compositiva simple. Relaciones semánticas.
●5. PNL con Python
Ajit Singh
Ajit Singh is equally interested in fiction and non-fiction and has written many books in English, Hindi, and Urdu. He has performed in Haryana, published his prose and verse in India and Pakistan, and participated in an international online poetry symposium organized by Bazm-e-Urdu, Qatar.He lives in a village, teaches science, and comes from a farming family. His father served as a major in the Parachute Regiment of the Indian Army.Ajit plays cricket, football, volleyball, basketball, badminton, and chess. He loves harmonium and flute, sings folk songs, and also enjoys gardening in his spare time. His nickname is "Badal," which means "cloud" in English.
Lee más de Ajit Singh
5G Simplemente en Profundidad Calificación: 0 de 5 estrellas0 calificacionesAgile & Scrum Calificación: 0 de 5 estrellas0 calificacionesRealidad Virtual Calificación: 2 de 5 estrellas2/5Computación Verde y Administración de la Energía Calificación: 0 de 5 estrellas0 calificaciones
Relacionado con Procesamient o de Lenguaje Natural con Python
Libros electrónicos relacionados
Colecciones de datos y algoritmos en Python: de cero al infinito Calificación: 0 de 5 estrellas0 calificacionesIntroducción a los Algoritmos y las Estructuras de Datos 1: Introducción a los Algoritmos y las Estructuras de Datos, #1 Calificación: 0 de 5 estrellas0 calificacionesAprende a programar en Python: de cero al infinito Calificación: 0 de 5 estrellas0 calificacionesEstructuras de datos en java Calificación: 0 de 5 estrellas0 calificacionesAprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesComputación y programación funcional Calificación: 0 de 5 estrellas0 calificacionesPython para filósofos Calificación: 3 de 5 estrellas3/5El camino a las redes neuronales artificiales Calificación: 0 de 5 estrellas0 calificacionesAprende a Programar en Python Calificación: 5 de 5 estrellas5/5Introducción a los Algoritmos y las Estructuras de Datos, 1: Una base sólida para el mundo real del aprendizaje de máquinas y la estructura de datos Calificación: 0 de 5 estrellas0 calificacionesTeoría, diseño e implementación de compiladores de lenguajes.: PROGRAMACIÓN INFORMÁTICA/DESARROLLO DE SOFTWARE Calificación: 5 de 5 estrellas5/5Matemáticas Discretas:: Con un enfoque desde la ingeniería y ciencias sociales - Conceptos básicos Calificación: 0 de 5 estrellas0 calificacionesAprendiendo Python: Desde los Fundamentos hasta la Programación Avanzada: La colección de TI Calificación: 0 de 5 estrellas0 calificacionesDatos Informáticos Calificación: 0 de 5 estrellas0 calificacionesEstructura de datos: Un enfoque con Python, java y C++ Calificación: 0 de 5 estrellas0 calificacionesConceptos Básicos De Scrum: Desarrollo De Software Agile Y Manejo De Proyectos Agile Calificación: 4 de 5 estrellas4/5Introducción a la programación con Python Calificación: 0 de 5 estrellas0 calificacionesReversing. Ingeniería Inversa Calificación: 0 de 5 estrellas0 calificacionesPython fácil Calificación: 4 de 5 estrellas4/5Iniciando a Programar con Python.: Guía básica de programación Calificación: 0 de 5 estrellas0 calificacionesIngeniería de prompts para neófitos Calificación: 0 de 5 estrellas0 calificacionesAprendizaje Automático En Acción: Un Libro Para El Lego, Guía Paso A Paso Para Los Novatos Calificación: 1 de 5 estrellas1/5Python, Aprendiendo a Utilizar Python Calificación: 0 de 5 estrellas0 calificacionesAdministración de Sistemas Gestores de Bases de Datos (2ª Edición) Calificación: 0 de 5 estrellas0 calificacionesPython a su alcance Calificación: 4 de 5 estrellas4/5TypeScript, Curso Práctico Calificación: 0 de 5 estrellas0 calificacionesAprende a Programar Swift - Tercera Edición Calificación: 0 de 5 estrellas0 calificacionesBitcoin Calificación: 0 de 5 estrellas0 calificacionesLa Guía Definitiva Para Desarrolladores De Software: Trucos Y Conseños Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Monetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5La IA curso de Inteligencia Artificial de principiante a experto: Curso de campo aprenderas todo sobre la inteligencia Artificial explicado paso a paso para mejor entendimiento Calificación: 0 de 5 estrellas0 calificacionesKlara y el Sol Calificación: 5 de 5 estrellas5/5Mecatrónica Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Guía para seres pensantes Calificación: 0 de 5 estrellas0 calificacionesDominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Arquitectura de computadoras Calificación: 0 de 5 estrellas0 calificacionesChat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la programación: Algoritmos y su implementación en vb.net, c#, java y c++ Calificación: 0 de 5 estrellas0 calificacionesChatGPT La Máquina de Dinero del 2024 De Novato a Prodigio en el Uso de Indicaciones de manera Rápida. Un Curso Completo para Principiantes en Inteligencia Artificial. Calificación: 0 de 5 estrellas0 calificacionesCómo triunfar en Instagram usando ChatGPT: La guía definitiva para crear contenido impactante con ChatGPT Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: chatgpt práctico para empresas Calificación: 0 de 5 estrellas0 calificacionesEl modelo para ganar dinero de ChatGPT para emprendedores Calificación: 0 de 5 estrellas0 calificacionesMáquinas predictivas: La sencilla economía de la inteligencia artificial Calificación: 5 de 5 estrellas5/5Cómo Triunfar en Facebook usando ChatGPT: El poder de ChatGPT: descubre cómo puede transformar tu estrategia en Facebook Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5Introducción a la computación cuántica para ingenieros Calificación: 0 de 5 estrellas0 calificacionesMinería De Procesos Convertir Datos En Valor Calificación: 0 de 5 estrellas0 calificacionesEl mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5Escritura Creativa con ChatGPT: Integrando ChatGPT en el Proceso Creativo de la Escritura de Ficción Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: la cuarta revolución industrial Calificación: 0 de 5 estrellas0 calificacionesMonitoreo, control y adquisición de datos con arduino y visual basic.net Calificación: 0 de 5 estrellas0 calificacionesEstructuras de Datos Básicas: Programación orientada a objetos con Java Calificación: 5 de 5 estrellas5/5Introducción a la Ingeniería Industrial Calificación: 0 de 5 estrellas0 calificacionesANDROID: Aprende desde cero a crear aplicaciones Calificación: 0 de 5 estrellas0 calificacionesCómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesProgramacion Orientada a Objetos y Estructura de Datos a Fondo Calificación: 0 de 5 estrellas0 calificacionesFundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificaciones
Comentarios para Procesamient o de Lenguaje Natural con Python
0 clasificaciones0 comentarios
Vista previa del libro
Procesamient o de Lenguaje Natural con Python - Ajit Singh
Contenido
Este libro tiene como objetivo presentar las técnicas fundamentales del
del lenguaje natural, desarrollar una comprensión de los límites de esas técnicas y de los temas de investigación actuales, y evaluar algunas aplicaciones actuales y potenciales.
1. Introducción. Breve historia de la investigación de la NLP, aplicaciones actuales, arquitectura genérica del sistema de la NLP, enfoques basados en el conocimiento versus enfoques probabilísticos.
2. Técnicas de estados finitos. En morfología seccional y derivacional, autómatas de estado finito en NLP, transductores de estado finito.
3. Predicción y etiquetado de partes del discurso. Corpora, DIY Corpus, Corpus Analysis, N-gramas simples, predicción de palabras, etiquetado estocástico y evaluación del rendimiento del sistema.
4. Análisis y generación. Gramática generativa, gramáticas libres de contexto, parsing y generación con gramáticas libres de contexto, pesos y probabilidades. Gramática basada en restricciones, unificación, semántica compositiva simple. Relaciones semánticas
5. NLP con Python
Derechos de autor © Ajit Singh 2022
Reservados todos los derechos. Ninguna parte de este trabajo puede reproducirse de ninguna forma ni por ningún medio sin el permiso por escrito del editor. Hago todo lo posible para respetar los derechos de autor.
Prefacio
La NLP es un campo amplio y multidisciplinario, por lo que este libro solo puede proporcionar una introducción muy general. El primer capítulo está diseñado para dar una visión general de las principales subáreas y una idea muy breve de las principales aplicaciones y las metodologías que se han empleado. La historia de la NLP se discute brevemente como una forma de poner esto en perspectiva. Los próximos tres capítulos describen algunas de las principales subáreas con más detalle. La organización se basa en una mayor profundidad
del procesamiento, comenzando con técnicas relativamente orientadas a la superficie y progresando hasta considerar el significado de las oraciones y los enunciados en contexto. Cada capítulo considerará la subárea como un todo y luego describirá uno o más algoritmos de muestra que abordan problemas particulares. Se han elegido los algoritmos porque son relativamente sencillos de describir y porque ilustran una técnica específica que ha demostrado ser útil, pero la idea es ejemplificar un enfoque, no dar una encuesta detallada (que sería imposible en el tiempo disponible). Sin embargo, a veces se discutirán brevemente otros enfoques. El capítulo final reúne el material anterior para describir el estado del arte en aplicaciones de muestra.
Objetivos:
El objetivo de mi libro para los estudiantes es:
1. ser capaz de describir la arquitectura y el diseño básico de un sistema de NLP genérico Caparazón
.
2. ser capaz de analizar el rendimiento actual y futuro probable de varias aplicaciones de NLP, como la traducción automática y la respuesta por correo electrónico.
3. ser capaz de describir brevemente una técnica fundamental para procesar el lenguaje para varias subtareas, como el análisis morfológico, el análisis sintáctico, la desambiguación del sentido de las palabras, etc.
4. Comprender cómo estas técnicas se basan y se relacionan con otras áreas de la informática (teórica), como la teoría del lenguaje formal, la semántica formal de los lenguajes de programación o la demostración de teoremas.
Características clave:
1. Discusión de los principales problemas involucrados en el procesamiento del lenguaje por medio de ejemplos tomados de aplicaciones de NLP con distinciones metodológicas y coloca las aplicaciones y la metodología en un contexto histórico.
2. Discusión de la morfología, concentrándose principalmente en la morfología inglesa. El concepto de un léxico en un sistema NLP se discute con respecto al procesamiento morfológico. Se introducen las reglas de ortografía y se explica el uso de transductores de estado finito para implementar reglas de ortografía.
3. Introduce algunas técnicas estadísticas simples e ilustra su uso en NLP para la predicción de palabras y categorías de partes del discurso. Comienza con una discusión de los corpus y luego introduce la predicción de palabras. La predicción de palabras puede verse como una forma de modelar (crudamente) cierta información sintáctica (es decir, el orden de las palabras).
4. NLP con Python
5. Cuerpo de bricolaje
Capítulo 1: Introducción a la PNL
Las personas se comunican de muchas maneras diferentes: hablando y escuchando, haciendo gestos, usando señales manuales especializadas (como cuando conducen o dirigiendo el tráfico), usando lenguaje de señas para sordos o a través de varias formas de texto. Por texto entendemos palabras que están escritas o impresas en una superficie plana (papel, tarjeta, letreros de calles, etc.) o que se muestran en una pantalla o dispositivo electrónico para que las lea su destinatario (o quienquiera que esté pasando). por).
Este curso se centrará solo en el último de ellos: nos ocuparemos de las diversas formas en que los sistemas informáticos pueden analizar e interpretar textos, y supondremos, por comodidad, que estos textos se presentan en formato electrónico. Esta es, por supuesto, una suposición bastante razonable, dada la enorme cantidad de texto a la que podemos acceder a través de la World Wide Web y la creciente disponibilidad de versiones electrónicas de periódicos, novelas, libros de texto y, de hecho, guías temáticas. Este capítulo presenta algunos conceptos, técnicas y terminología esenciales que se aplicarán en el resto del curso. Parte del material de este capítulo es un poco técnico, pero no hay programación involucrada en esta etapa.
Comenzaremos considerando los textos como cadenas de caracteres que pueden dividirse en subcadenas, e introduciremos algunas técnicas para describir informalmente patrones de varios tipos que ocurren en los textos. Posteriormente más adelante comenzaremos a motivar el análisis de los textos en términos de estructuras jerárquicas en las que se pueden incrustar elementos de diversa índole unos dentro de otros, de forma comparable a los elementos que componen un documento web HTML. Esta sección presenta algunos mecanismos técnicos como: máquinas de estado finito (FSMs), expresiones regulares, gramáticas regulares y gramáticas libres de contexto.
Conceptos básicos
Coincidencia de patrón y texto tokenizado
Una de las operaciones más básicas que se pueden aplicar a un texto es la tokenización: dividir un flujo de caracteres en palabras, signos de puntuación, números y otros elementos discretos. Entonces, por ejemplo, la cadena de caracteres
Dr. Watson, Sr. Sherlock Holmes
, dijo Stamford, presentándonos.
Se puede tokenizar como en el siguiente ejemplo, donde cada token está encerrado entre comillas simples:
`' `Dr.' 'Watson' ',' 'Sr.' 'Sherlock' 'Holmes' '
' ',' 'dijo' 'Stamford' ',' 'presentándonos' 'nosotros' '.
En este nivel, las palabras no han sido clasificadas en categorías gramaticales y tenemos muy poca indicación de la estructura sintáctica. Aún así, se puede obtener una buena cantidad de información a partir de un análisis relativamente superficial del texto tokenizado. Por ejemplo, supongamos que queremos desarrollar un procedimiento para encontrar todos los nombres de personas en un texto dado. Sabemos que los nombres personales siempre comienzan con mayúsculas, pero eso no es suficiente para distinguirlos de los nombres de países, ciudades, empresas, caballos de carreras, etc., o de las mayúsculas al comienzo de una oración. Algunas formas adicionales de identificar nombres personales incluyen:
Uso de un título Dr., Sr., Sra., Srta., Profesor, etc.
Una palabra o palabras en mayúsculas seguidas de una coma y un número, generalmente por debajo de 100: esta es una forma común de referirse a las personas en los informes de noticias, donde el número representa su edad, por ejemplo, Pierre Vinken, 61, . . .
Una palabra en mayúscula seguida de un verbo que generalmente se aplica a los humanos: dijo, informó, afirmó, pensó, argumentó. . . Esto puede generarse en exceso en el caso de nombres de países u organizaciones, como argumenta la Corona o afirma Gran Bretaña.
Podemos expresarlos de manera más concisa de la siguiente manera, donde j es el símbolo de disyunción, Word representa una palabra en mayúsculas e Int es un número entero:
(Dr. j Professor j Mr. j Mrs. j Miss j Ms) Word
Word Word, Int
Word (said j