Cómo Profundizar en Data Science

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 8

Cómo profundizar en Data Science

ALDANO PELUSSO·LUNES, 27 DE NOVIEMBRE DE 2017·

Libros "de cabecera" del tema

 Mining Massive Datasets [Free Online] http://mmds.org

 The Elements of Statistical Learning https://web.stanford.edu/~hastie/Papers/ESLII.pdf

 An Introduction to Statistical Learning with Applications in R (James-Witten-


Tibshirani-Hastie) disponible online!

Cursos online

 Diplomatura con R y Python - Instituto Data Science de Argentina


www.institutodatascience.org (200 Horas, clases grupales personalizadas e
interactivas)

 Stanford CS246: Mining Massive Datasets [Material Online]


http://web.stanford.edu/class/cs246/

 Stanford CS224W: Analysis of Networks [Material Online]


http://web.stanford.edu/class/cs224w/

 fast.ai: Practical Deep Learning for Coders, Cutting Edge Deep Learning for Coders,
Cursos muy didáctios y prácticos. De acá salió la revolución de NLP de 2018

 A.C.G.F.I.U.B.A. Asociación Centro de Graduados de la Facultad de Ingeniería de la


U.B.A. https://graduadosfiuba.org/: Se imparten para profesionales distintos tipos de
cursos de actualización en Data Science e Inteligencia Artificial (detalles en sección
Cursos presenciales)

Cursos presenciales

 Digital House: Curso de Data Science (196 horas, arranca uno nuevo cada semestre)
P1(8)
 Digital House: Curso de Inteligencia Artificial y algorítmica Deep Learning (168 horas)

 EANT: Curso de Data Scientist (135 horas en 2 módulos, dan la opción de hacer sólo el
#1)

 Facultad de Medicina - UBA: Curso de introducción a Ciencia de Datos en Salud (un


cuatrimestre, presencial)

 Acámica: Curso de Data Science. Toca temas de machine Learning, NLP, Clustering,
Deep Learning, Cloud A.I. y Deployment. Formato semi presencial de 6 meses de
duración. Sedes en Buenos Aires y Córdoba.

 A.C.G.F.I.U.B.A. Asociación Centro de Graduados de la Facultad de Ingeniería de la


U.B.A. https://graduadosfiuba.org/ : Se imparten para profesionales distintos tipos de
cursos de actualización en Data Science e Inteligencia Artificial, en formato
presencial y remoto; (a) Introducción a Tensorflow para Inteligencia Artificial, Machine
Learning y Deep Learning - Curso a distancia, (b) Análisis de datos con Python - Curso a
distancia, (c) Machine Learning a fondo - Curso a distancia, (d) Especialización en Deep
Learning - Curso a distancia. Para aquellos que no tienen conocimientos en
programación; Programación Python - NIVEL 1 - Curso a distancia y Programación Python
- NIVEL 2 - Curso a distancia. Se completa la oferta de actualización con un curso de
SCRUM - Curso a distancia, para conocer el marco de trabajo Ágil, norma en la
industria de IT y desarrollo de software.

Laboratorios / Investigación

 Facultad de Ingeniería, Universidad de Buenos Aires (UBA). Laboratorio de Ciencia


de Datos. Interesados en desarrollar proyectos de investigación por favor
contactarse. Web: http://www.fi.uba.ar/es/node/2509 y/o https://labdac.github.io/

 Laboratorio de Inteligencia Artificial Aplicada, Departamente de Computacion, UBA


https://liaa.dc.uba.ar/es/inicio/

 Investigación Teórica y Aplicada de la Escuela de Estadística (IITAE), Facultad de


Ciencias Económicas y Estadística. Universidad Nacional de Rosario (UNR). Web

P2(8)
Posgrados relacionados con Ciencia de Datos

 UBA CS Exactas, Maestría/Especialización en Explotación de Datos y Descubrimiento del


Conocimiento

 UNLP Informática, Especialización en Inteligencia de Datos orientada a BIG DATA

 UNLP Informática, Maestría en Inteligencia de Datos orientada a BIG DATA (en


proceso de aprobación por CONEAU)

 San Andres, Maestría en Ciencia de Datos (2 años, las charlas informativas son en oct)

 Di Tella, Master in Management + Analytics [el MiM+Analytics de UTDT sintetiza dos


tendencias con amplia expansión reciente a nivel global: la formación en
management, y el entrenamiento en el uso de herramientas de analytics orientados a
jóvenes profesionales] (15 meses)

 Univ. Austral, Maestría en Data Mining (560 horas); Maestría en Ciencia de Datos

 ITBA, Diplomatura en Big Data (4 meses)

 ITBA, Especialización en Ciencia de Datos (1 año, 10 materias aprox, $172.000 a 2017)

 UP, Programa Ejecutivo de Big Data y Analytics (16 semanas)

 UAI, Diplomatura en Data Science para Finanzas y Negocios (81 horas)

Mas información de algunos posgrados de la lista de arriba en el Catálogo de oferta académica


provisto por la Fundación Sadosky

Posgrados relacionados con Estadísticas

 UBA CS exactas, Maestría/Especialización en Estadística Matemática

 UNTREF, Maestría en Generación y Análisis de Información Estadística.


http://www.untref.edu.ar/posgrado/maestria-en-generacion-y-analisis-de-informacion-
estadistica

 UN Córdoba, Maestría en Estadística Aplicada

 UN Rosario, Maestría en Estadística Aplicada; Doctorado en Estadística

P3(8)
 UN Tucuman, Maestría en Estadística Aplicada

Programas de grado que tengan algo de Data Science

 Facultad de Ingeniería, UBA. [75.06 Organización de Datos] (Somos amistosos con


oyentes y curiosos). Se cursa Lunes y Jueves de 19 a 22 durante 16 semanas. Los
oyentes deben completar los trabajos prácticos y un regimen de asistencia para
obtener un certificado. El curso es completamente gratuito.
https://www.facebook.com/groups/457169454398562/. La próxima edición arranca el 13
de Abril de 2020 ? (fijarse post de los administradores).

 Nueva! Facultad de Ingeniería, UBA. [91.54 Ciencia de Datos para la Toma de


Decisiones] Materia electiva para la carrera de Ingeniería Industrial. Se enseña: pre-
procesamiento y análisis exploratorio, visualización, modelos de ML, NLP, Computer
Vision, todo con programación con R. Arranca en Agosto 2019.

 INFORMACIÓN IMPORTANTE sobre Licenciatura en Ciencia de Datos en Exactas, UBA


(alguna irá quedando confirmada o descartada a lo largo del año 2020)
o la carrera se encuentra atravesando el proceso de Aprobación en un estadio
avanzado i.e. Consejo Superior de la universidad; hay una expectativa fundada
en que alumnos puedan inscribirse a ella desde ago-20, pero antes...

o si a abr-20 estás por empezar la UBA y te interesa la Ciencia de Datos: podés


iniciar el CBC inscripto en Matemática, Computación o Física, cursar las 6
(seis) asignaturas y las mismas se te reconocerán para la Lic en Data Science,
una vez oficializada ésta

o si a abr-20 cursaste el CBC con Sociedad y Estado, Pensamiento Científico, Análisis,


Álgebra, Física y Química aprobadas: podés pasarte a Matemática, Computación o
Física, en el caso de estar inscripto en otra carrera, y cursar las materias del plan de
Ciencia de Datos que formen parte de currículas de otras licenciaturas, como...
 Análisis I (materia obligatoria para Matemática, Computación y Física)

 Álgebra I (materia obligatoria para Matemática, Computación y Física)

 una a elección de la rama de Ciencias Naturales, que se pedirá para Data


Science

P4(8)
 Introducción a la Biología Molecular y Celular

 Química General e Inorgánica (la versión para Cs Biológicas)

 Física I (la versión para Cs Químicas)

o por último, si a abr-20 tenés aprobado el CBC, Análisis I, Álgebra I y Física I


(ej. sos alumno de 3er año de Lic en Física) podés anotarte para cursar Álgebra
Lineal o Algoritmos I, las mismas se te reconocerán para la Lic en Data Science
(y de forma similar, si hiciste los primeros años de Matemática o
Computación, podés cursar la materia electiva de la rama de Naturales o
Análisis II o Algoritmos II; la idea es que sigas avanzando y te “enganches” con
la carrera de Ciencia de Datos en ago-20)

 Por fuera de lo anterior cada cuatrimestre en Exactas-UBA se dan materias


(regulares u optativas de Licenciaturas en Matemática, Computación o Física) y
cursos de formación (mayormente en el ámbito del Instituto de Cálculo); todos
requieren inscripción previa - a veces alcanza con presentarse al docente el primer
día de clases; ojo, no se dictan siempre; la oferta es amplia: Inteligencia Artificial,
Machine Learning, Ciencia de Datos, Redes Neuronales, Redes Neuronales
Profundas, Procesamiento Digital de Imágenes, Procesamiento del Habla, cursos de
Estadística (tanto teóricos como aplicados, Series de Tiempo, Modelo Lineal,
Estadística en Física Experimental, etc), Probabilidades, Optimización, Investigación
Operativa, Análisis Numérico, Teoría de Juegos, etc. También se enseña a programar
Python o R en talleres.

 Facultad de Informática, UNLP.


o Minería de Datos usando Sistemas Inteligentes (optativa, no todos los semestres)
Minería con Rapidminer y python.

o Fundamentos y Aplicaciones de Aprendizaje Automático (optativa, no todos los


semestres, se dicta en años pares)

o Conceptos y Aplicaciones de Big Data (optativa, no todos los semestres)


Taller práctico de Hadoop (map-reduce, hive, pig), Spark y Spark-Streaming.

o Aprendizaje Automático Profundo (optativa, no todos los semestres)


Redes Neuronales con Keras para procesamiento de imágenes.

P5(8)
 Carrera de Lic en Informática en Universidad Nacional del Oeste: Explotación de
Datos.

 Nueva! Carrera de Analítica Empresarial y Social en ITBA. Además: materias de la


Ingeniería en Informática, como Sistemas de Inteligencia Artificial, Visualización de
Información, Base de Datos Espaciales y GIS, Aprendizaje Automático (machine
learning), El paradigma NoSQL - Bases de Datos de Grafos, Base de Datos I y II.

 Di Tella: cuenta con un campo menor en Tecnología y Ciencia de Datos. Para obtener
el campo menor se deben cursar 3 de las siguientes 4 materias: MAAN II
(introducción a la programación, se usa Python), Marketing Digital (en colaboración
con Digital House), Análisis y Visualización de datos, Introducción a Data Science
(se usa R).

 San Andres: hay tres cursos de licenciatura fuertes en cuestiones de datos...


Econometria, Economía Aplicada (experimentos y evaluacion de impacto), y Big
Data y Aprendizaje. La maestria en economia es tambien intensiva en cuestiones
estadisticas-econometricas-datos. La oferta regular incluye Econometria Avanzada,
Microeconometria, Series Temporales, Modelos Esctructurales (analisis estadistico
de teoria de juegos) y Analisis de Datos Espaciales.

 Nueva! UTN BA: Cátedra electiva “Ciencia de Datos” (clusterAI) en 5to año de
Ingenierìa Industrial. Se enseña Python, preprocesamiento de datos, analisis
exploratorio, modelos clasicos de ML supervisado, no supervisado, NLP (sentiment
analysis + collaboratory filtering), clasificacion de imagenes con DL.

 UTN: curso externo de Introducción al Data Mining (14 clases, pantallazo general de
técnicas más un trabajo integrador)

 UNTREF: Lic. en Estadistica - http://www.untref.edu.ar/carrera/estadistica Es una


excelente alternativa a una falta de carreras de grado especificas de Data Science.

 UNR (Rosario): Lic. en Estadistica https://www.fcecon.unr.edu.ar/web-


nueva/carreras/licenciatura-en-estadistica

 Nueva! Universidad Torcuato Di Tella: Lic. en Tecnología Digital


https://www.utdt.edu//ver_contenido.php?
id_contenido=19866&id_item_menu=31534#historia

P6(8)
Temas importantes

Detallando lo de arriba, los temas rondan los que interesan a este grupo. Dando una vista muy
sesgada por lo que hago yo, pero haciéndolo extensivo a lo que hacen todo el resto de nosotros
también, eso va desde:

Lenguajes de programación...

[Para los que vienen y no vienen del área de informática o afines recomiendo cualquiera de los
cursos gratuitos de EDX con un amplio abanico de ofertas gratuitas]

 R
o https://www.datacamp.com/tracks/data-scientist-with-r ( pago )

 Python
o https://www.codecademy.com/catalog/language/python

 SQL

Frameworks

 Spark
o https://www.coursera.org/learn/scala-spark-big-data

Tools

 Hive

 Presto

... pasando por Paquetes para dichos lenguajes...

 R
o https://www.tidyverse.org/

o ggplot

o prophet

 Python
o pytorch

... hasta Temas teóricos

 estadistica
P7(8)
 apredizaje como bandits y TS

 probabilidad

 optimizacion

 machine learning
o https://www.coursera.org/learn/machine-learning/

 clustering

Personalidades ( twitter / youtube / otros )

Para listar personalidades interesantes y que sean de referencia en el tema de data science.

 Tamara Munzner (visualizacion) https://twitter.com/tamaramunzner

 Andrew Ng (machine learning) https://twitter.com/AndrewYNg

 Andrej Karpathy (machine learning) https://twitter.com/karpathy

 Siraj Raval (AI youtube channel)


https://www.youtube.com/channel/UCWN3xxRkmTPmbKwht9FuE5A

 Alex 'Sandy' Pentland (data science) https://twitter.com/alex_pentland

 Juan Gabriel Gomila (Udemy instructor) https://www.udemy.com/user/juangabriel2/

P8(8)

También podría gustarte