Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Desde $11.99 al mes después de la prueba. Puedes cancelar en cualquier momento.

Procesamient o de Lenguaje Natural con Python: COMPUTADORAS
Procesamient o de Lenguaje Natural con Python: COMPUTADORAS
Procesamient o de Lenguaje Natural con Python: COMPUTADORAS
Libro electrónico143 páginas1 hora

Procesamient o de Lenguaje Natural con Python: COMPUTADORAS

Calificación: 0 de 5 estrellas

()

Leer vista previa

Información de este libro electrónico

Este libro tiene como objetivo presentar las técnicas fundamentales del procesamiento del lenguaje natural, desarrollar una comprensión de los límites de esas técnicas y de los temas de investigación actuales, y evaluar algunas aplicaciones actuales y potenciales. 

● 1. Introducción. Breve historia de la investigación de la PNL, aplicaciones actuales, arquitectura genérica del sistema de la PNL, enfoques basados ​​en el conocimiento versus enfoques probabilísticos. 

●2. Técnicas de estados finitos. En morfología seccional y derivacional, autómatas de estado finito en PNL, transductores de estado finito.

 ●3. Predicción y etiquetado de partes del discurso. Corpora, DIY Corpus, Corpus Análisis, N-gramas simples, predicción de palabras, etiquetado estocástico y evaluación del rendimiento del sistema. 

●4. Análisis y generación. Gramática generativa, gramáticas libres de contexto, parsing y generación con gramáticas libres de contexto, pesos y probabilidades. Gramática basada en restricciones, unificación, semántica compositiva simple. Relaciones semánticas. 

●5. PNL con Python

IdiomaEspañol
EditorialBadPress
Fecha de lanzamiento16 nov 2022
ISBN9781667444840
Procesamient o de Lenguaje Natural con Python: COMPUTADORAS
Autor

Ajit Singh

Ajit Singh is equally interested in fiction and non-fiction and has written many books in English, Hindi, and Urdu. He has performed in Haryana, published his prose and verse in India and Pakistan, and participated in an international online poetry symposium organized by Bazm-e-Urdu, Qatar.He lives in a village, teaches science, and comes from a farming family. His father served as a major in the Parachute Regiment of the Indian Army.Ajit plays cricket, football, volleyball, basketball, badminton, and chess. He loves harmonium and flute, sings folk songs, and also enjoys gardening in his spare time. His nickname is "Badal," which means "cloud" in English.

Lee más de Ajit Singh

Relacionado con Procesamient o de Lenguaje Natural con Python

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Procesamient o de Lenguaje Natural con Python

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Procesamient o de Lenguaje Natural con Python - Ajit Singh

    Contenido

    Este libro tiene como objetivo presentar las técnicas fundamentales del

    del lenguaje natural, desarrollar una comprensión de los límites de esas técnicas y de los temas de investigación actuales, y evaluar algunas aplicaciones actuales y potenciales.

    1. Introducción. Breve historia de la investigación de la NLP, aplicaciones actuales, arquitectura genérica del sistema de la NLP, enfoques basados ​​en el conocimiento versus enfoques probabilísticos.

    2. Técnicas de estados finitos. En morfología seccional y derivacional, autómatas de estado finito en NLP, transductores de estado finito.

    3. Predicción y etiquetado de partes del discurso. Corpora, DIY Corpus, Corpus Analysis, N-gramas simples, predicción de palabras, etiquetado estocástico y evaluación del rendimiento del sistema.

    4. Análisis y generación. Gramática generativa, gramáticas libres de contexto, parsing y generación con gramáticas libres de contexto, pesos y probabilidades. Gramática basada en restricciones, unificación, semántica compositiva simple. Relaciones semánticas

    5. NLP con Python

    Derechos de autor © Ajit Singh 2022

    Reservados todos los derechos. Ninguna parte de este trabajo puede reproducirse de ninguna forma ni por ningún medio sin el permiso por escrito del editor. Hago todo lo posible para respetar los derechos de autor.

    Prefacio

    La NLP es un campo amplio y multidisciplinario, por lo que este libro solo puede proporcionar una introducción muy general. El primer capítulo está diseñado para dar una visión general de las principales subáreas y una idea muy breve de las principales aplicaciones y las metodologías que se han empleado. La historia de la NLP se discute brevemente como una forma de poner esto en perspectiva. Los próximos tres capítulos describen algunas de las principales subáreas con más detalle. La organización se basa en una mayor profundidad del procesamiento, comenzando con técnicas relativamente orientadas a la superficie y progresando hasta considerar el significado de las oraciones y los enunciados en contexto. Cada capítulo considerará la subárea como un todo y luego describirá uno o más algoritmos de muestra que abordan problemas particulares. Se han elegido los algoritmos porque son relativamente sencillos de describir y porque ilustran una técnica específica que ha demostrado ser útil, pero la idea es ejemplificar un enfoque, no dar una encuesta detallada (que sería imposible en el tiempo disponible). Sin embargo, a veces se discutirán brevemente otros enfoques. El capítulo final reúne el material anterior para describir el estado del arte en aplicaciones de muestra.

    Objetivos:

    El objetivo de mi libro para los estudiantes es:

    1. ser capaz de describir la arquitectura y el diseño básico de un sistema de NLP genérico Caparazón.

    2. ser capaz de analizar el rendimiento actual y futuro probable de varias aplicaciones de NLP, como la traducción automática y la respuesta por correo electrónico.

    3. ser capaz de describir brevemente una técnica fundamental para procesar el lenguaje para varias subtareas, como el análisis morfológico, el análisis sintáctico, la desambiguación del sentido de las palabras, etc.

    4. Comprender cómo estas técnicas se basan y se relacionan con otras áreas de la informática (teórica), como la teoría del lenguaje formal, la semántica formal de los lenguajes de programación o la demostración de teoremas.

    Características clave:

    1. Discusión de los principales problemas involucrados en el procesamiento del lenguaje por medio de ejemplos tomados de aplicaciones de NLP con distinciones metodológicas y coloca las aplicaciones y la metodología en un contexto histórico.

    2. Discusión de la morfología, concentrándose principalmente en la morfología inglesa. El concepto de un léxico en un sistema NLP se discute con respecto al procesamiento morfológico. Se introducen las reglas de ortografía y se explica el uso de transductores de estado finito para implementar reglas de ortografía.

    3. Introduce algunas técnicas estadísticas simples e ilustra su uso en NLP para la predicción de palabras y categorías de partes del discurso. Comienza con una discusión de los corpus y luego introduce la predicción de palabras. La predicción de palabras puede verse como una forma de modelar (crudamente) cierta información sintáctica (es decir, el orden de las palabras).

    4. NLP con Python

    5. Cuerpo de bricolaje

    Capítulo 1: Introducción a la PNL

    Las personas se comunican de muchas maneras diferentes: hablando y escuchando, haciendo gestos, usando señales manuales especializadas (como cuando conducen o dirigiendo el tráfico), usando lenguaje de señas para sordos o a través de varias formas de texto. Por texto entendemos palabras que están escritas o impresas en una superficie plana (papel, tarjeta, letreros de calles, etc.) o que se muestran en una pantalla o dispositivo electrónico para que las lea su destinatario (o quienquiera que esté pasando). por).

    Este curso se centrará solo en el último de ellos: nos ocuparemos de las diversas formas en que los sistemas informáticos pueden analizar e interpretar textos, y supondremos, por comodidad, que estos textos se presentan en formato electrónico. Esta es, por supuesto, una suposición bastante razonable, dada la enorme cantidad de texto a la que podemos acceder a través de la World Wide Web y la creciente disponibilidad de versiones electrónicas de periódicos, novelas, libros de texto y, de hecho, guías temáticas. Este capítulo presenta algunos conceptos, técnicas y terminología esenciales que se aplicarán en el resto del curso. Parte del material de este capítulo es un poco técnico, pero no hay programación involucrada en esta etapa.

    Comenzaremos considerando los textos como cadenas de caracteres que pueden dividirse en subcadenas, e introduciremos algunas técnicas para describir informalmente patrones de varios tipos que ocurren en los textos. Posteriormente más adelante comenzaremos a motivar el análisis de los textos en términos de estructuras jerárquicas en las que se pueden incrustar elementos de diversa índole unos dentro de otros, de forma comparable a los elementos que componen un documento web HTML. Esta sección presenta algunos mecanismos técnicos como: máquinas de estado finito (FSMs), expresiones regulares, gramáticas regulares y gramáticas libres de contexto.

    Conceptos básicos

    Coincidencia de patrón y texto tokenizado

    Una de las operaciones más básicas que se pueden aplicar a un texto es la tokenización: dividir un flujo de caracteres en palabras, signos de puntuación, números y otros elementos discretos. Entonces, por ejemplo, la cadena de caracteres

    Dr. Watson, Sr. Sherlock Holmes, dijo Stamford, presentándonos.

    Se puede tokenizar como en el siguiente ejemplo, donde cada token está encerrado entre comillas simples:

    `' `Dr.' 'Watson' ',' 'Sr.' 'Sherlock' 'Holmes' '' ',' 'dijo' 'Stamford' ',' 'presentándonos' 'nosotros' '.

    En este nivel, las palabras no han sido clasificadas en categorías gramaticales y tenemos muy poca indicación de la estructura sintáctica. Aún así, se puede obtener una buena cantidad de información a partir de un análisis relativamente superficial del texto tokenizado. Por ejemplo, supongamos que queremos desarrollar un procedimiento para encontrar todos los nombres de personas en un texto dado. Sabemos que los nombres personales siempre comienzan con mayúsculas, pero eso no es suficiente para distinguirlos de los nombres de países, ciudades, empresas, caballos de carreras, etc., o de las mayúsculas al comienzo de una oración. Algunas formas adicionales de identificar nombres personales incluyen:

    Uso de un título Dr., Sr., Sra., Srta., Profesor, etc.

    Una palabra o palabras en mayúsculas seguidas de una coma y un número, generalmente por debajo de 100: esta es una forma común de referirse a las personas en los informes de noticias, donde el número representa su edad, por ejemplo, Pierre Vinken, 61, . . .

    Una palabra en mayúscula seguida de un verbo que generalmente se aplica a los humanos: dijo, informó, afirmó, pensó, argumentó. . . Esto puede generarse en exceso en el caso de nombres de países u organizaciones, como argumenta la Corona o afirma Gran Bretaña.

    Podemos expresarlos de manera más concisa de la siguiente manera, donde j es el símbolo de disyunción, Word representa una palabra en mayúsculas e Int es un número entero:

    (Dr. j Professor j Mr. j Mrs. j Miss j Ms) Word

    Word Word, Int

    Word (said j

    ¿Disfrutas la vista previa?
    Página 1 de 1