1. O documento discute os conceitos de informação, representação da informação e sistemas de recuperação da informação.
2. Apresenta linguagens documentárias como forma de organizar acervos e padronizar termos para buscas de informação.
3. Discute a importância da indexação para a representação e recuperação eficiente da informação nos sistemas.
1. O documento discute os conceitos de informação, representação da informação e sistemas de recuperação da informação.
2. Apresenta linguagens documentárias como forma de organizar acervos e padronizar termos para buscas de informação.
3. Discute a importância da indexação para a representação e recuperação eficiente da informação nos sistemas.
1. O documento discute os conceitos de informação, representação da informação e sistemas de recuperação da informação.
2. Apresenta linguagens documentárias como forma de organizar acervos e padronizar termos para buscas de informação.
3. Discute a importância da indexação para a representação e recuperação eficiente da informação nos sistemas.
1. O documento discute os conceitos de informação, representação da informação e sistemas de recuperação da informação.
2. Apresenta linguagens documentárias como forma de organizar acervos e padronizar termos para buscas de informação.
3. Discute a importância da indexação para a representação e recuperação eficiente da informação nos sistemas.
9. RELEVNCIA E PERTINNCIA........................................................................
10. IDENTIFICAO DE CONCEITOS...................................................................
11. A IMPORTNCIA DA INDEXAO PARA A RECUPERAO DA INFORMAO........................................................................................................ ............
11.1 Princpios do processo de indexao...................................................................
12. ESTUDO DE CAMPO: BIBLIOTECA.................................................................
1. INTRODUO. O presente estudo pretende sistematizar os principais conceitos abordados pela disciplina de Organizao do Conhecimento II, ministrada pela professora Deise Sabbag no primeiro semestre de 2013. O que informao, como representa-la, que sistemas podemos utilizar para recuperar esta informao so alguns dos conceitos que analisaremos para fundamentar nosso conhecimento sobre o processo de indexao de unidades informacionais. 2. O QUE INFORMAO. 3. A REPRESENTAO DA INFORMAO. 4. OS SISTEMAS DE RECUPERAO DA INFORMAO. Um sistema de recuperao da informao um sistema que tem por princpio armazenar e organizar a informao, com o objetivo de disponibilizar essa mesma informao da forma mais rpida e precisa possvel. Para isso, ele se utiliza de atividades como representao da informao, gesto de documentos e recuperao da informao. Poderamos dizer de outra forma tambm que: SRIs so a interface entre uma coleo de recursos de informao, em meio impresso ou no, e uma populao de usurios; e desempenham as seguintes tarefas: aquisio e armazenamento de documentos; organizao e controle desses; e distribuio e disseminao aos usurios (LANCASTER & WARNER apud SOUZA, 2006). Partindo dessas definies, podemos tentar fazer uma ponte com o filme A Origem, de Christopher Nolan, que conta a histria de profissionais que trabalham
para adentrar nas mentes das pessoas com o intuito de roubar segredos do subconsciente, ou at mesmo para introduzir uma ideia. Para tal, eles se utilizam dos sonhos que, manipulando diversos artifcios, conseguem compartilhar o sonho entre si. Antes mesmo de entrar nos sonhos das pessoas das quais desejam retirar uma informao, os profissionais precisam realizar todo um estudo sobre a pessoa desejada para que no ocorram falhas. Logo na cena inicial do filme, um erro causado pelo o que eles chamam de arquiteto, causa uma falha na estrutura do sonho onde se passa a cena, o que acaba levando ao insucesso da misso. Isto ocorreu porque o arquiteto no realizou de maneira eficiente as buscas de informaes e referncias sobre o indivduo em questo, o que nos remete importncia da preciso que deve conter um Sistema de Recuperao da Informao (SRI), levantando a ideia de que quanto mais bem estruturado ele for, mais preciso ele ser, e ocasionar, assim, menos falhas. O arquiteto, no filme, responsvel por estruturar todas as informaes adquiridas durante o processo de busca, distribuindo-as de forma que a pessoa em que se deseja extrair uma informao acredite que o sonho seja realmente real. Para tal, ele disponibiliza todas essas informaes em um mecanismo onde o sonho ser compartilhado. Isso requer ferramentas de controle mental e lgico rgidos para que o sonho no se altere e se mantenha realista. Logo, assim como o arquiteto, um SRI deve possuir esse alto controle lgico para que as informaes no se percam e acabe gerando uma m recuperao, o que no filme se configura na percepo da pessoa sonhadora de que o sonho no realidade, ou seja, um sistema falho. Mais adiante somos apresentados a todos na equipe que trabalham na construo do sonho, o que no nosso caso seria o SRI. Existe o extrator lder; o regulador do tempo; a arquiteta; o qumico; e ate mesmo um turista. Todos eles em funo de um nico objetivo: implantar uma ideia. No filme, eles trabalham disponibilizando, construindo e recuperando informaes sobre o alvo, sempre da melhor maneira possvel para que no ocorram erros, e dentro de um SRI eles seriam como ferramentas reguladoras que auxiliam e no permitem que ocorra um erro na busca de uma informao. Sendo assim, por meio do sonho, eles mantm
uma constante representao das informaes adquiridas sobre o alvo durante o processo de pesquisa do mesmo, o que permiti a otimizao do processo de busca da informao desejada. O problema que os profissionais trabalham para que uma informao seja extrada, recuperada, e o filme levanta exatamente uma ideia contrria a esse princpio: implantar uma ideia. Vrias questes so discutidas e, ao fim, decidi-se que o processo pode ser realizado, mas que seria difcil. A soluo proposta se reflete na construo de sonhos dentro de sonhos, algo completamente perigoso e que exigiria uma perfeita organizao dos conhecimentos de que cada um possua. No entanto, como diz Sfez (1996 apud SMIT, 2012, p.93) a informao por si s no concede conhecimento. Ento como implantar uma ideia para que ela seja processada como conhecimento a fim de que atingisse os objetivos dos profissionais dos sonhos? Smit (2012, p. 93) diz que [...] a apropriao da informao pelo individuo, visando a gerao de conhecimento novo, supe a existncia de um conhecimento anterior [...] bem como a disposio de alterar, completar ou rever este conhecimento. No filme isso mostrado como sendo a existncia de um testamento do pai de Fischer (indivduo que se deseja implantar a informao), que j tem conhecimento do mesmo. Como o conhecimento [...] gerado a partir de informaes estruturadas e interconectadas de forma totalmente subjetiva por cada indivduo (SMIT, 2012, p. 93), bastou aos profissionais dos sonhos disponibilizarem a Fischer informaes sobre seu pai (como memrias de infncia e/ou decepes, como foi visto) e manipul-las de maneira que o fizesse acreditar que o pai queria realmente o fim de sua empresa para que o filho erguesse sua prpria, o que, por fim, comprovou que para uma informao gerar conhecimento, antes de mais nada, necessrio a existncia de um conhecimento anterior. Assim, a partir da anlise apresentada acima, acredita-se que possvel manter ideias e discusses pertinentes ao filme A Origem, de Christopher Nolan, e relacionadas aos estudos dos SRIs.
5. LINGUAGENS DOCUMENTRIAS
Para que haja a organizao do acervo de modo que a informao obtida em uma busca no seja incoerente com o que o usurio procura, necessria uma padronizao, e para que isso ocorra utiliza-se uma linguagem documentria que pode ser um tesauro, lista, anel de sinnimo, taxonomia, sistema de classificao, ontologia, etc. Se formos pensar na construo de uma unidade de informao, alguns termos so adotados na construo da unidade, tendo em vista a criao de um sistema de recuperao da informao acessvel e funcional, poupando o tempo do usurio. E dentro destes sistemas que usamos a linguagem documentria, que um conjunto de termos providos ou no de regras sintticas utilizadas para representar contedos dos documentos tcnico-cientficos com fins de classificao ou busca retrospectiva de informao". (CINTRA). Linguagens documentrias determinam os termos que sero interpretados na busca pela informao, facilitando o acesso e a transferncia de informao. Conforme Lara: A denominao Linguagem Documentria (LD), alm de referir-se ao conjunto dos diferentes tipos de instrumentos especializados no tratamento da informao bibliogrfica (sistemas de classificao enciclopdico ou facetados e tesauros), designa, de modo mais amplo e completo, a linguagem especialmente construda para organizar e facilitar o acesso e a transferncia da informao. (LARA, 2004, p. 232) Exemplificando o que linguagem documentria, temos os vocabulrios controlados, que nos elucidar o que a linguagem documentaria. Os vocabulrios controlados nada mais so do que termos restritos, no sentido de que acompanham o modelo para a recuperao da informao, que utilizado em uma unidade de informao. Esses vocabulrios solucionam os problemas de sinonmias e polissemias no momento em que aproximam conceitos e termos autorizados na busca, como por exemplo, o tesauro. Alguns exemplos de vocabulrios controlados so: lista, anel de sinnimo,
ontologias, taxonomias e tesauros. A lista composta por termos pr-determinados que servem como um catlogo de terminologia padronizada auxiliando no controle de sinnimos e facilitando a indexao e recuperao da informao entre outras funes. O anel de sinnimo um grupo de termos que so considerados sinnimos com o propsito de recuperao. As Ontologias representam formalmente o conhecimento atravs de uma serie de conceitos e termos de um domnio. A ontologia segundo SALES; CAF [...] define o vocabulrio usado para compor expresses complexas. O objetivo da ontologia viabilizar um comum acordo no uso do vocabulrio compartilhado de uma maneira coerente e consistente. J para FEITOSA (2006), O uso de ontologias fornece uma grande possibilidade de se descrever objetos e suas relaes com outros objetos. Taxonomia, segundo CAMPOS: por definio, classificao, sistemtica e est sendo conceituadas no mbito da Cincia da Informao como ferramenta de organizao intelectual. empregada em portais institucionais e bibliotecas digitais como um novo mecanismo de consulta, ao lado de ferramentas de busca. Alm destas aplicaes, a taxonomia um dos componentes em Ontologias. A organizao das informaes atravs do conceito de Taxonomia permite alocar, recuperar e comunicar informaes dentro de um sistema de maneira lgica atravs de navegao. Este estudo apresenta o mtodo de categorizao bem como os princpios e cnones para elaborao de taxonomias como meios de representao e de acesso, j testado em servios de informao de diferentes naturezas e propsitos. Quanto ao Tesauro consideramos que este um vocabulrio controlado e dinmico de termos relacionado semntica e genericamente cobrindo um domnio especfico do conhecimento (UNESCO apud CAMPOS, 2001) exercendo a funo de um dispositivo de controle terminolgico usado na traduo da linguagem natural dos documentos, dos indexadores ou dos usurios numa linguagem do sistema (linguagem de documentao, linguagem de informao) mais restrita." (UNESCO
apud CAMPOS, 2001). Sendo assim um conjunto de conceitos e termos prximos que facilitam o acesso, a busca e a recuperao da informao, sendo essencial na criao de sistemas de recuperao de informao, que faz parte de uma unidade de informao. O tesauro uma ferramenta que auxilia na recuperao da informao e sua organizao assim como CAVALCANTI (1978) afirma: Tesauro uma lista estruturada de termos associada empregada por analistas de informao e indexadores, para descrever um documento com a desejada especificidade, em nvel de entrada, e para permitir aos pesquisadores a recuperao da informao que procura. O tesauro necessita da criao de um vocabulrio controlado anteriormente a sua construo, uma vez que formado por descritores relacionados. A unidade de informao pesquisada pelo grupo, opta pelo vocabulrio e pelo tesauro afinal, a rea em que est situada, especializada e por isso deve haver uma padronizao maior para que haja uma recuperao da informao mais eficaz. 5.1 Vocabulrio Controlado uma ferramenta para auxiliar os profissionais da informao na descrio de assuntos e itens referentes aos documentos que formam um acervo, ele padroniza a classificao da informao e permite a busca por esses termos padronizados evitando a padronizao da informao. Existem quatro tipos de vocabulrio controlado que se diferenciam de acordo com o nvel de complexidade das suas estruturas: lista, anel de sinnimo, taxonomia e tesauro conforme podemos ver na figura abaixo:
6. INDEXAO E SEUS ASPECTOS HISTRICOS Indexar consiste numa operao de descrever e identificar um documento com ajuda de informaes contidas nesse documento, transcrevendo atravs de anlise e linguagem documental cada item importante que dever ser includos numa base de dados, permitindo assim uma pesquisa eficaz das informaes buscadas pelos seus usurios. Segundo F. W. Lancaster, a indexao de assuntos normalmente feita visando a atender s necessidades de sua clientela, tomando decises importantes no s ao tratamento do documento, mas tambm ao interesse das informaes disponibilizadas para seus usurios. Assim sendo, o processo de indexao pode ser descrito em trs operaes bsicas referentes atividade de indexao, sendo elas: 1. Anlise - leitura e segmentao do texto para a identificao e a seleo de conceitos; 2. Sntese - construo do texto documentrio com os conceitos selecionados; 3. Representao - ou traduo, por meio de linguagens documentrias. A indexao surgiu como atividade de elaborao de ndices, como instrumento de armazenagem e recuperao da informao, teve a sua origem a
partir da necessidade do homem que passou a se preocupar na acessibilidade da informao registrada num documento e como ordenar essa informao. A forma mais antiga de armazenamento de informao so as tbuas de argilas produzidas na poca da Mesopotmia no sculo II a.C. onde eram gravadas resumos de livros antigos (WITTY, 1973). A Biblioteca de Alexandria era ordenada por classificao de Calmaco, tinha o catlogo organizado em ordem alfabtica de autores e subordinados a assuntos mais gerais. No sculo II Cludio Galeno compilou De Libris Propiis Liber, onde aparecem os primeiros guias para obras isoladas, como cabealhos de captulos, sumrios. No sculo V, a obra annima Apothegmata obra, apresentou um ndice alfabtico de assuntos, consistido de uma listagem de provrbios gregos sobre tpicos teolgicos. As obras eram arranjadas em captulos e sees numeradas, facilitando a localizao de suas partes. No sculo XIV, temos a elaborao de inventrios, catlogos e listas dos livros existentes em mosteiros. Surgindo assim os guias para cada livro, os cabealhos de captulos, os cabealhos em pargrafos nas margens, lista de contedo, lista de resumos ou diversas notas. No sculo XVII, a Reforma Protestante possibilitou traduo da Bblia, dando incio a poca do ndice e tornando acessvel para as pessoas. No sculo XVIII a lngua inglesa estabelece os pontos que seriam indexados e qual o termo a entrada. A Alemanha contribui com a ideia de palavras-chaves como auxlio da representao de um item, melhorando assim a busca de informaes. Com o surgimento da imprensa por Guttemberg, ocorre um significativo aumento na literatura, o aparecimento de vrias listas com diferentes finalidades. Com o surgimento das publicaes peridicas, a indexao passou a ter maior ateno com a elaborao de uma tcnica de organizao por assunto para estes tipos de documentos. Em 1876, Melvil Dewey publica o ndice relativo da
Classificao Decimal, sendo uma grande contribuio para a indexao. Nos Estados Unidos, aparecem os melhores ndices de peridicos, j na Europa W. F. Poole responsvel pela criao dos grandes ndices dos peridicos do sculo XIX. Em 1901, os mtodos de indexao tiveram um grau de aprimoramento significativo referentes aos peridicos, onde cada artigo era indexado por autor e por assunto. A indexao evoluiu dos ndices das obras isoladas para os ndices cooperativos, ndices de vrios volumes, associando prticas de indexar documentaes atravs de ttulos, datas, locais, autores, instituies, entre outros. Teve grandes contribuies com Paul Otlet e Henri La Fontaine criadores do Office International de Bibliographie de 1892, o uso da palavra Documentao em 1931, a criao de grandes rgos voltados nas atividades de documentao como: o FID (Institut International de Docomentation) e o UFOD (Union Franaise des Organismes de Documentation) responsveis pela criao de instrumentos de organizao documentria como a classificao bibliogrfica utilizando a Classificao CDU (Classificao Decimal Universal), os estudos sobre a criao de sistemas de classificao por Bliss e Ranganathan realizados em 1929 e 1931, a criao do CDD (Classificao Decimal de Dewey) e a introduo do principio da pr-coordenada por Otlet e La Fontaine, ao utilizarem na CDU o uso de dois pontos para relacionar duas classes de assunto. [...] um conjunto ordenado de cdigos representativos de assuntos, tpicos ou conceitos (por exemplo, cdigos de classificao, grafismos diversos, incluindo palavras ou frases), os quais podem servir como critrios de busca relacionando com alguma chave de acesso que permita localizar os documentos ou suas partes ou representaes relativos a cada assunto. (ROBREDO, 1994, p.244). 7. REVOCAO, PRECISO. Uma das formas de avaliar a indexao por meio da recuperao de documentos analisando os ndices de preciso e revocao do sistema. Estes so conceitos de grande importncia para elaborar indicadores de desempenho de
bases de dados ou sistemas de recuperao de informao. Para Lancaster, apesar de existirem outras abordagens, revocao e preciso so medidas a serem utilizadas para expressar os resultados de qualquer busca que simplesmente divida uma base de dados em recuperados e no recuperados. Segundo ele a revocao a capacidade de um sistema de informao de recuperar documentos teis; e preciso, a capacidade evitar documentos inteis. Um dos critrios recomendveis para a avaliao de linguagens documentrias na recuperao da informao, o emprego dos ndices quantitativos revocao e preciso. A revocao indica a frao dos documentos relevantes observada dentre os documentos examinados. J a Preciso a capacidade de evitar documentos inteis na recuperao pelo sistema, ela indica a frao dos documentos j examinados que so relevantes. Pode-se concluir, ento, que quanto mais propenso a um, mais precisa ser a busca, pois maior ser a quantidade de itens relevantes recuperados efetivamente. A preciso e revocao so inversamente proporcionais, ou seja, quanto maior a preciso de um sistema, menor ser sua revocao. Pode-se dizer, ento, que em grandes bancos de dados e na Web, alm de recuperar informao, as iniciativas devem objetivar, principalmente, a preciso dos resultados das buscas, pois um aumento na revocao geraria como resultado muitos registros a serem examinados, sob risco de poucos deles serem relevantes para a busca efetuada. A indexao traz uma melhoria na preciso de sistemas de recuperao de informao. Se o objetivo de um sistema de informao recuperar informao, ento preciso e revocao so pontos a serem considerados e medidas que podem fornecer, de certa forma, parmetros para a avaliao de um sistema de indexao, seja ele automtico ou no. 8. RELEVNCIA E PERTINNCIA.
O leitor s aceita ler sobre informaes e idias de duas naturezas: pertinentes que pertencem estritamente ao assunto da comunicao, e relevantes que so fundamentais para a compreenso, o conhecimento e a tomada de deciso. Toda comunicao escrita deve, portanto, ser produzida apenas com o que pertinente e relevante, ao mesmo tempo. Assim, o leitor encontra, sem ter que ler n pginas com informaes desnecessrias, exatamente aquilo que lhe interessa. como se houvesse uma agulha sob uma folha de papel e no mais uma agulha no palheiro, difcil de encontrar. A relevncia a qualidade do tema de um artigo que determina se este tem pertinncia e adequado para incluso no projeto. O tema de um artigo deve ser suficientemente notvel, ou digno de notcia, para ser includo no sistema. Quanto mais pessoas se interessam por um determinado assunto, e fizerem meno a ele, este se torna relevante. Isso porque entendemos que se as pessoas esto dando um voto de confiana para esse assunto, aumentando assim sua autoridade, ela uma noo intuitiva e uma medida determinada no somente pela relao entre documento e pergunta mais tambm em termos de relaes entre os documentos, uma relao comparativa. A Cincia da Informao tem tentado entender e explicar o fenmeno atravs de diversas abordagens (matemtica, estatstica, filosfica) no podendo ser estudada como um fenmeno isolado dependente de muitos fatores do processo de comunicao. Relevncia, a mais importante propriedade da informao, a medida de contato efetivo entre a fonte e o destinatrio. J a pertinncia a qualidade do que pertinente. Trata-se de um adjetivo que faz meno quilo que pertence ou que corresponde quilo ou a quem vem mesmo a propsito e de forma oportuna. Exemplos: Acho que um comentrio que no tem qualquer pertinncia e que s traz mais preocupaes, No quero ouvir coisas sem pertinncia, A proposta de Gomes demonstrou a sua pertinncia ao resolver um dos principais problemas da empresa. Existem vrias abordagens para a noo de pertinncia. Num sentido similar, a pertinncia de uma investigao est relacionada com o espao social onde
integraro os conhecimentos adquiridos aos resultados de um trabalho de pesquisa A pertinncia, por conseguinte, a adequao ou o sentido de algo num determinado contexto. Pertinncia a disponibilidade, a prontido para a mudana. Na indexao no basta ter muitos termos, preciso que cada um tenha pertinncia e relevncia para o contedo temtico. Pois assim sero abordados os temas de interesse. Na indexao delimitam-se tambm os conceitos que devem estar compreendidos no vocabulrio, pela sua pertinncia e relevncia no momento da pesquisa, assim como permitem excluir da linguagem documental termos que no correspondem aos parmetros considerados eficientes para a pesquisa. 9. LEITURA TCNICA DO DOCUMENTO Para selecionarmos os Descritores corretos para nossa indexao, temos que nos apropriar do contedo informacional do documento atravs da leitura. Porm a urgncia e a demanda de tarefas do dia a dia tornam essa leitura integral invivel. Para facilitar essa tarefa, existe a leitura tcnica ou anlise conceitual. Leitura Tcnica a leitura de pontos do documento considerados mais importantes ou fontes principais para retirada dos Descritores Primrios, Secundrios, Pr-codificados e Tipo de Publicao. Se analisarmos o texto seguindo os determinados passos, possvel fazer uma leitura tcnica identificando os pontos mais importantes e necessrios para o entendimento das informaes presentes no texto. Os principais passos da leitura tcnica ou anlise conceitual so: Ler e interpretar o significado do ttulo - o ttulo normalmente representa o contedo, ento devemos procurar traduzir em descritores todas as palavras que nele aparecem, mesmo quando pensamos que seja insignificante ou que no exista no Descritores da cincia; Localizar o ponto onde o autor descreve o objetivo do estudo, muito importante. Normalmente encontra-se no final da introduo;
No devemos indexar o contedo da introduo, a menos que este seja bastante discutido no documento, mas tambm no podemos desprez-la porque a introduo til para entendimento do estudo, j que nela o autor faz uma pequena reviso e/ou explanao sobre o assunto; Rastreie pargrafo por pargrafo, verificando palavras em negrito, sublinhadas, nomes de sees. Nessas partes, na maioria das vezes, encontramos Descritores Secundrios como: tipo de estudo, gnero, idade, mtodos estatsticos etc; medida que for lendo, v selecionando os descritores e adicionando na sua indexao. importante no saltar pargrafos; Indexe somente temas e aspectos de temas discutidos e no os meramente mencionados. Nessa hora, o indexador deve tentar fazer o exerccio de se colocar no lugar do pesquisador e ater-se ao realmente discutido no documento, pois indexar conceitos deduzidos ou somente mencionados pode desviar o pesquisador do foco de sua pesquisa. Caso considere que determinado assunto ser til para uma pesquisa, ento dever index-lo; Leia cada palavra do resumo ou concluso para confirmar se todos os temas discutidos j foram cobertos. Pela concluso teremos a confirmao se a proposta do ttulo e objetivo foi cumprida, ou seja, se todas as questes apresentadas foram analisadas. Ento, podemos confirmar se os Descritores Primrios que escolhemos representam realmente o ponto focal do estudo; Pargrafos indicados pelo autor como "Discusso" so indexveis somente se houver relao direta com o tema do documento; Verifique as citaes bibliogrficas, pois as referncias servem como orientao na identificao do assunto e podem auxiliar tambm na definio do que primrio ou secundrio; Verifique as palavras-chave indicadas pelo autor, se existirem elas tambm servem como auxlio na identificao do assunto ou de um aspecto; Verifique o resumo somente para confirmar se o que est relatado nele j foi objeto de indexao. No se indexa lendo apenas o resumo, essa
uma prtica totalmente desaconselhvel, pois nem sempre os resumos retratam fielmente o contedo do documento e muita informao importante pode ficar perdida. Lembre-se sempre de fazer a conferncia verificando cuidadosamente os descritores atribudos, respondendo s seguintes perguntas: Os descritores principais representam o ponto focal do documento? As coordenaes apropriadas foram atribudas? Os elementos do ttulo foram indexados? Os descritores secundrios foram de fato discutidos, ou foram meramente mencionados? Resultados negativos considerados significativos foram indexados? Qual a abordagem do documento? Leitura tcnica se bem estruturada e organizada facilita e simplifica mais o trabalho da indexao. 10. IDENTIFICAO DE CONCEITOS O processo de indexao se faz por meio de duas etapas principais: a anlise do item e a traduo do resultado desta anlise pra uma linguagem uniformizada de recuperao. A etapa de anlise do item compreende a leitura tcnica do documento para identificao e seleo de conceitos que representem o contedo informacional do mesmo. Fujita baseia-se em Princpios da Indexao do World Information System for Science and Technology para recomendar que a identificao de conceitos seja feita obedecendo a um esquema de categorias existentes na rea coberta pelo documento, como por ex.: o fenmeno, o processo, as propriedades, as operaes, o material, o equipamento, etc.. A autora alerta ainda que nem todos os conceitos identificados seriam utilizados como dados de recuperao. A etapa seguinte seria a seleo dos conceitos atinentes aos objetivos e interesses da instituio e de seus usurios. Para normatizar esse processo a Associao Brasileira de Normas Tcnicas
ABNT - publicou em 1992 a Norma 12.676, que fixa condies exigveis para a prtica normalizada do exame de documentos, da determinao de seus assuntos e da seleo de termos de indexao. A norma reconhece a impraticabilidade de se fazer a leitura total dos documentos sugerindo o exame minucioso de determinadas partes como: ttulo, resumo, sumrio entre outras. Sugere tambm que os servios de indexao elaborem listas com os aspectos importantes para a rea de cobertura da instituio. O foco nas necessidades e caractersticas da comunidade de usurios, bem como a importncia do feedback obtido atravs dos pedidos de informao so apontados pela ABNT como norteadores do aprimoramento de processo de indexao. 11. A IMPORTNCIA DA INDEXAO PARA A RECUPERAO DA INFORMAO Devido ao grande nmero de publicaes na sociedade como um todo, h em geral uma urgncia pela busca da informao relevante e pertinente e que atenda as necessidades dos usurios, de forma rpida e objetiva. Mesmo j existindo elaborados programas de indexao automtica para auxilio nesta tarefa, ainda no se pode dispensar a anlise intelectual na representao temtica, pois estas ferramentas possuem algumas limitaes que prejudicam o resultado de uma busca. A indexao deve ter como base, o documento em sua totalidade, sendo descritos neste processo tanto os aspectos principais quanto os secundrios como, metodologia cientfica utilizada, caractersticas do documento, tipos de estudos, entre outros. Podemos afirmar que a indexao importante devido h vrios fatores, porque propicia: Alto grau de consistncia e especificidade na recuperao das informaes contidas nos documentos; Recuperao do documento mais relevante possvel para o assunto pesquisado; Refinamento da pesquisa por meio da lgica booleana, ou incluso de
novos termos e descritores; Aumento da abrangncia da pesquisa por meio da exploso de categorias; Categorizao da recuperao da informao; Reduo do tempo despendido pelo usurio ou pesquisador na recuperao da informao necessria ao seu objetivo. Caso no haja uma indexao, a procura pela informao se torna limitada pesquisa livre no ttulo e resumo e estes nem sempre representam fiel e objetivamente o contedo de um documento. A indexao um processo de grande importncia na representao do contedo e no resultado da recuperao da informao, onde preciso responsabilidade do indexador na atribuio de descritores a um documento, alm de cuidado e ateno na utilizao dos termos durante o processo de indexao para melhor compreenso da funo e aplicao de cada um deles. Veja abaixo conceitos importantes quanto descrio de um documento: Indexao Processo pelo qual descrito o contedo de um documento a partir da aplicao de descritores, depois da leitura tcnica e anlise do texto. Descritores Termos extrados de um vocabulrio controlado. Qualificadores Termos que definem aspectos de um assunto qualificando o descritor adotado. Os qualificadores esto sempre associados a descritores, especificando o mximo possvel um determinado assunto. Descritores pr-codificados So termos que caracterizam os sujeitos ou objetos de pesquisa. Podem se
dividir, por exemplo, em: tipo, gnero, grupos etrios, perodo histrico. Tipos de Publicao Termos usados para descrever o formato ou desenho do estudo (mais que o contedo) do documento. Ex: carta, editorial, relato de caso, reviso, etc. Os termos de indexao: Descritores, Qualificadores, Pr-codificados e Tipo de Publicao so utilizados na indexao de forma sistemtica, e o indexador deve sempre se atentar a isso, pois disso depende a aplicao e seguimento adequado e consistente dos demais direcionamentos da poltica e prtica de indexao. A descrio de um documento e a forma pela qual essa descrio ser feita tambm de fundamental importncia na indexao, essa, que pode ser realizada a partir de uma descrio pr- coordenada ou ps- coordenada. Descritores Pr-coordenados so termos compostos criados para facilitar a representao de um assunto, por exemplo: uma doena, um processo fisiolgico ou um servio de sade. O Descritor foi formado com a juno de um ou mais Descritores para formar um nico conceito. Descritores ps-coordenao, nada mais so que a seleo de vrios Descritores (termo simples ou pr-coordenado) para representar um determinado assunto. Exemplo: Descritores Pr-coordenados: Responsabilidade administrativa social - formado por: Responsabilidade + Administrao + Sociedade Descritores Ps-coordenados: Direito Comercial + Responsabilidade civil + Constituio. Juntou-se 3 descritores pr-coordenados para representar um assunto. 10.1 Princpios do processo de indexao
Ao atribuir Descritores, o indexador dever seguir os seguintes princpios: Especificidade - atingir o maior grau de especificidade possvel. Se um documento trata especificamente de Sociedade por aes no dever ser indexado com um Descritor geral como Sociedade ou Direito Societrio. Concordncia - seguir a hierarquia dos Descritores e as regras que forem estabelecidas para que orientem o seu uso. Coerncia - aplicar consistentemente as regras de indexao. Os Descritores devero ser usados sempre da mesma forma. Assim, o usurio poder confiar que localizar os mesmos conceitos no mesmo lugar com um ndice de previsibilidade razovel. Imparcialidade no predizer qual dos aspectos de um trabalho pode ser de interesse para este ou aquele usurio. Deve abster-se de emitir avaliaes ou opinies pessoais e enfocar todos os assuntos em todos os seus aspectos de forma imparcial e sem preconceitos. O documento em mos a maior autoridade sobre ele mesmo. Um indexador diligente a segunda maior autoridade. Multiplicidade - atribuir a cada documento tantos Descritores quantos forem necessrios para descrev-lo em todos seus aspectos. A isto se denomina indexao mltipla. Fidelidade - escolher Descritores que reproduzam fielmente o contedo do documento. Assim, o usurio encontrar facilmente o documento de seu interesse, pois o Descritor selecionado o conduziu at a informao relevante que procurava. Bom Senso - omitir dados irrelevantes e no pertinentes, sem sacrificar a imparcialidade, especificidade, multiplicidade ou veracidade. Deve servir-se da sua familiaridade com o assunto, o tipo de peridico no qual est publicado o artigo, sua qualidade, poltica editorial e qualquer outro aspecto do seu conhecimento ou experincia. Deve ser objetivo para julgar a parte substancial do texto digna de recuperao, abstendo-se de avaliar o trabalho do autor.
12. ESTUDO DE CAMPO: BIBLIOTECA JURDICA PELLON A biblioteca escolhida para nosso estudo de campo foi a Biblioteca Jurdica Pellon, do escritrio de advocacia Pellon & Associados, situada no Centro da cidade do rio de Janeiro. Fomos atendidos pela bibliotecria snior Vaneza Fernandes Escudeiro, responsvel pelo setor, e pelo estagirio Ricardo Pedroza. A maioria das informaes foram passadas por email, mas tambm foi realizada uma visita ao local. A Pellon & Associados organizou e inaugurou sua biblioteca junto a fundao do escritrio, em 1991. No decorrer dos anos o setor esteve em crescimento constante, formando um arquivo rico e atualizado em Seguros e Resseguros, alm de documentos importantes da rea de especializao que retratam o perodo da crise econmica relacionados ao mercado de seguros, atravs de pareceres dos seus scios e associados. A Biblioteca com o decorrer da sua histria estabeleceu por misso dar suporte pesquisa do advogado para o cumprimento de suas tarefas, com a viso de otimizar seu trabalho, oferecendo-lhe informao atualizada a partir da consulta a bases de dados de acesso pago e/ou desenvolvidas pelo Escritrio, livros e peridicos em meio impresso e eletrnico, com o objetivo de auxili-lo no alcance da excelncia da sua produo intelectual. A Biblioteca Jurdica Pellon, encontra-se subordinada ao setor de Gerncia Administrativa que possui o comando de um administrador, que tambm tem a responsabilidade sobre os setores de Arquivo e Recursos Humanos. Todas as solicitaes, problemas e etc so repassados pela bibliotecria responsvel a esse administrador para, frente a gerncia geral, tomar as providncias cabveis. A bibliotecria passa assim a coordenar o funcionamento geral da biblioteca com a funo de manter em pleno funcionamento o setor com o auxlio de um estagirio. Nessa hierarquia as atribuies esto assim distribudas: Administrador: Previso oramentria e aprovao/anlise de compras. Bibliotecria: Seleo, aquisio, catalogao, indexao e recuperao da informao. Estagirio: Catalogao, servio de referncia, formao de vocabulrio
controlado (com superviso da Bibliotecria), treinamento de usurios. O quadro de funcionrios da Biblioteca composto por uma Bibliotecria Snior e um estagirio. A Bibliotecria coordena as funes de seleo, aquisio, catalogao, indexao, atendimento de referncia e disseminao seletiva da informao. A informtica adquiriu, est implantando e parametrizando um sistema de controle de processos, informao e documentao com base unificada, atravs de um portal, onde ir permitir ao cliente/usurio o acompanhamento de todos os casos em andamento e encerrados, livros e acervo em geral atravs de seu prprio computador, via internet/ intranet, mediante o uso de senha. O usurio pode consultar o andamento processual, gerar relatrios gerenciais e estatsticos, consultar agendas de audincias, solicitar livros, documentos, pesquisas e etc., tornando desnecessria a duplicao de informaes na empresa. Nos dois organogramas abaixo podemos identificar, primeiro a posio da Biblioteca no contexto geral da empresa, e a seguir a hierarquia funcional dentro da Biblioteca. Organograma 1
Organograma 2 A Biblioteca composta por um salo dividido em dois ambientes: um para leitura e pesquisas com uma de mesa com 6 lugares, e outro para armazenagem das obras de acervo geral e demais materiais alocados em 18 estantes. O espao conta com um ar condicionado 19 graus estvel, 2 computadores para processamento do acervo e uma bancada para trabalho. A Biblioteca jurdica Pellon possui um acervo especializado em Direito, priorizando as reas de Seguro, Previdncia e Capitalizao, Resseguro, Energia, Telecomunicaes, Trabalhista, Societrio, Tributrio, Arbitragem. Acervo este composto por seis mil ttulos, incluindo Obras de Referncia, Doutrinas e Materiais Especiais. (DVD, CD). O acervo possui livre acesso entre as estantes, podendo ser tambm solicitado por e-mail Biblioteca. As aquisies so realizadas atravs da necessidade exposta pelos advogados durante reunies do Conselho administrativo nas quais se faz presente a Bibliotecria Snior. Aps o que solicita a compra efetiva das publicaes solicitadas, nas mais variadas mdias, mediante cotao feita entre livrarias/distribuidoras legalizadas. A Catalogao e a Indexao, so feitas pela anlise conceitual, registro e
identificao visual (gerao de etiquetas/cdigos de barra) em base de dados e no ttulo adquirido para posterior recuperao da informao por parte dos leitores e gestores da Biblioteca, de acordo com as normas ditadas pelo Cdigo de Catalogao Anglo-Americano e a Associao Brasileira de Normas Tcnicas. Os usurios da Biblioteca Jurdica Pellon, compem um pblico fechado, entre advogados, estagirio e os funcionrios do escritrio, que utilizam o setor no mbito de pesquisa jurdica de legislao, jurisprudncia e doutrinas, estando diariamente presentes, acompanhando as constantes mudanas da rea, e mantendo uma relao direta com os profissionais da rea de informao: a bibliotecria e o estagirio. A Biblioteca conta com servios dirios de consulta s bases de dados da Empresa (WinJuris, Cadoc) com o auxlio de um profissional da rea informacional. Ao usurio requerer uma obra, o bibliotecrio consulta o sistema e, de acordo com o pedido, indica ao usurio os ttulos disponveis para leitura. Caso a Biblioteca no tenha a obra ou essa esteja defasada, rapidamente, um novo ttulo ou uma nova edio comprada, para suprir as necessidades de informao dos usurios. Decorre da o fato de as compras serem feitas constantemente. oferecido tambm o servio de pesquisas sobre jurisprudncias, legislaes e doutrinas em geral, e realizado constantemente uma seleo das ltimas informaes sobre a rea de Direito de Seguros (especialidade do escritrio) gerando dessa forma Boletins dirios enviados por e-mail aos usurios. Periodicamente realizado um estudo junto aos leitores e livrarias/distribuidores, por meio impresso ou eletrnico, para a seleo do que deve ser comprado, nas mais variadas mdias, permutado ou pedido, em doao, a outras Bibliotecas/centro de documentao. A aquisio conforme citado anteriormente conta com a indicao dos advogados atravs da reunio do conselho administrativo, cujos nomes so citados no formulrio de solicitao de cheques para aquisio das obras, alm do acompanhamento feito pelo bibliotecrio sobre os lanamentos do mercado editorial. A divulgao e o marketing da Biblioteca Pellon, realizada atravs de treinamento de usurios de forma mensal, ensinando-os a utilizar os mecanismos da base de dados da Biblioteca. Promove-se tambm o acervo atravs de um informe
jurdico, destinados aos clientes da empresa e aos funcionrios, informando novas aquisies e artigos novos lanados para consulta. A Biblioteca tem por sua gesto nas finalidades de procedimentos: Atender de forma objetiva seus usurios atravs do Setor de Referncia Consulta s Bases de Dados da Empresa onde ao usurio requerer uma obra, o bibliotecrio consulta o sistema e, de acordo com o pedido, indica ao usurio os ttulos disponveis para leitura. Caso a Biblioteca no tenha a obra ou essa esteja defasada, rapidamente, um novo ttulo ou uma nova edio comprada, para suprir as necessidades de informao dos usurios. Decorre da o fato de as compras sem feitas constantemente. Realizar o processo de Seleo atravs de estudo feito junto aos leitores e livrarias/distribuidores, por meio impresso ou eletrnico, para a seleo do que deve ser comprado, nas mais variadas mdias, permutado ou pedido, em doao, a outras Bibliotecas/centro de documentao. A seleo conta com a indicao dos advogados, cujos nomes so citados no formulrio de solicitao de cheques para aquisio das obras, alm do acompanhamento feito pelo bibliotecrio sobre os lanamentos do mercado editorial. Aquisio atravs de setor responsvel pela compra efetiva das publicaes solicitadas, nas mais variadas mdias, mediante cotao feita entre livrarias/distribuidoras legalizadas com responsabilidade de coordenao da Bibliotecria Snior. Cadastramento/Indexao/Catalogao, atravs de setor responsvel pela anlise conceitual, registro e identificao visual (gerao de etiquetas/cdigos de barra) em base de dados e no ttulo adquirido para posterior recuperao da informao por parte dos leitores e gestores da Biblioteca, de acordo com as normas ditadas pelo Cdigo de Catalogao Anglo-Americano e a Associao Brasileira de Normas Tcnicas. Realizar o devido ordenamento e armazenamento das obras e documentos em estantes ou suportes adequados seguindo os padres ditados pelo sistema de classificao adotado pela Empresa. Atualizar os Manuais da Roncarati a cada alterao na legislao de seguro, a Editora Roncarati manda a norma atualizada que manualmente atualizada nos respectivos manuais, Com execesso da parte de Seguros
que a editora agora oferece de forma On-line. A biblioteca tem como planejamento atender futuramente seus usurios de forma digital, facilitando o acesso e o decorrer das pesquisas. No que se diz a gesto interna o regulamento de utilizao da Biblioteca dispe: 1. No recolocar o material consultado na estante; 2. Devolver o material emprestado dentro do prazo estabelecido (3 dias utis) 3. No retirar da biblioteca, livros, peridicos e matrias especiais sem o consentimento do funcionrio responsvel; 4. No retirar os livros e demais publicaes do escritrio; 5. No emprestar a outrem livros, sob a guarda, sem antes dar baixa na Biblioteca; 6. No entrar com pastas, volumes e/ou bolsas na Biblioteca 7. Ao se desligar do escritrio, devolver Biblioteca todo o material que lhe foi emprestado. O software utilizado o RM Biblos, da TOTVS, que tem interface MARC, porque a instituio unificou todos os seus processos com o software RM dessa Empresa. Quando os campos de catalogao so preenchidos (nvel 2 + acrscimos), o programa converte para o formato MARC. O campo de indexao do MARC utilizado o 650. At o ano passado a instituio usava o termo livre. Com a utilizao do Biblos, o proprietrio da empresa foi sensibilizado para a adoo da terminologia controlada, que atualmente utilizada. O vocabulrio de termos controlados do STJ e os dicionrios especializados em Direito de Maria Helena Diniz e de Plcido e Silva so os mais consultados. A profissional responsvel d preferncia ps- coordenao, seguindo os ensinamentos de Lancaster. S utilizando a pr- coordenao em casos de termos compostos, em que os sentidos dos mesmos sejam alterados na ps-coordenao. O processo de indexao realizado atravs das seguintes etapas: 1. Leitura das partes principais do livro (prefcio, introduo, sumrio e
concluso) ou leitura do artigo de peridico (resumo, introduo e concluso); 2. Extrao dos termos e verificao dos mesmos no sistema; 3. Em caso de termo inexistente, consulta base do STJ e/ou Dicionrios tcnicos de Direito. Em situaes muito especficas o corpo tcnico consultado. 4. Atribuio do termo. Ao final de todo o processo, todos os termos armazenados so exportados e feita uma verificao geral, para ento lanar o vocabulrio e difundi-lo, por meio de DSI, aos usurios. A poltica de indexao est sendo formada agora com a utilizao do novo sistema. A preciso privilegiada, pois o usurio tem a necessidade de uma informao rpida. A maior dificuldade apontada pela indexadora o controle de sinonmia, que tratada, atentando aos termos utilizados pelas suas ferramentas de controle documentrio e as correlaes que elas fazem (uso do VER, USE e VER TAMBM). Segundo a entrevistada, para uma recuperao da informao que objetive a preciso, necessrio que se tenha, dentre outros fatores, uma padronizao de vocabulrio. nesse ponto que entra o controle de palavras sinnimas. Vaneza exemplifica explicando que tutela antecipada igual antecipao de tutela no Direito. Na literatura jurdica encontraremos os dois termos sendo utilizados pelos juristas. Caber a ns, indicarmos a forma a ser adotada pelo nosso sistema. E, seja qual for essa forma, teremos que indicar o termo que no foi utilizado, usando o recurso do USE ou UP. Tal recurso guiar o usurio, pois seja qual for o termo usado por ele na pesquisa, ele ter uma resposta positiva. Reitera ainda que a Lngua Portuguesa repleta de sinnimos, por isso precisamos ter esse controle que feito durante a construo da Linguagem Documentria e posterior ela. No final do meu processo, vou exportar todos os termos gerados e vou revisar incorrees. A indexao, nesta instituio, realizada com muito cuidado e, na dvida, os
dicionrios tcnicos so sempre consultados para melhor entender os termos. Nessa rea, mais uma vez Lancaster citado como fonte segura de orientao.
13. CONSIDERAES FINAIS Para finalizar, nas Consideraes Finais relacionar a parte terica com a parte prtica do trabalho; e com a palestra do professor Fbio Pinho sobre "tica na Organizao e Representao do Conhecimento".
Referncias
A ORIGEM. Produo de Christopher Nolan. Califrnia: Warner Bros., 2010.
CAMPOS, Maria Luiza de Almeida; GOMES, Hagar Espanha. Taxonomia e Classificao: O Princpio de Categorizao. Datagramazero: Revista de Cincia da Informao, Niteri, v. 9, n. 4, ago. 2008. Disponvel em: <http://www.dgz.org.br/ago08/Art_01.htm>. Acesso em: 02 ago. 2013.
CARDOSO, Olinda Nogueira Paes. Recuperao de Informao. UFLA Universidade Federal de Lavras DCC Departamento de Cincia da Computao. Minas Gerais, p.2. Disponvel em:< http://www.dcc.ufla.br/infocomp/artigos/v2. 1/art07.pdf> Acesso em: 08 ago. 2013.
CAVALCANTI, C. R. Indexao e tesauro: metodologia e tcnica, Braslia, ABDF, 1978.
CINTRA, A. M. M. Estratgias de leitura em documentao. In: SMIT, J.W. (coord.) Anlise documentria: a anlise da sntese. 2. ed. Braslia : IBICT, 1989. P.63-79.
CINTRA, Ana Maria et al. Para entender as linguagens documentrias. 2 ed. So Paulo: Polis, 2002.
CRISTINA, Vivian. A pertinncia. Rio de Janeiro. Disponvel em:< http://www.escreverbem.com.br/pt-br/pertinencia.html Pertinncia e Relevncia> Acesso em: 06 ago. 2013.
FIGUEIREDO, Laura Maia de. O conceito de relevncia e suas implicaes. Rio de Janeiro: IBICT/ CTR, p. 75-78, 1997. Disponvel em: <http://boo- box.com/?utm_source=publisher- website&utm_medium=bbbeacon&utm_campaign=bbbeacon>. Acesso em: 06 ago. 2013.
FILHO, Carlos. O que relevncia? Disponvel em:< http://vivendocidade.com/o- que-e-relevancia> Acesso em: 08 ago. 2013.
FUJITA, M. S. L. A identificao de conceitos no processo de anlise de assunto para indexao. Revista Digital de Biblioteconomia e Cincia da Informao, Campinas, v. 1, n. 1, jul. 2003. Disponvel em: <http://bibli.fae.unicamp.br/revbib/index.html>. Acesso em: 15 jul. 2013.
LANCASTER, F. Wilfrid. Indexao e resumos: teoria e prtica. 2. ed. -. Braslia: Briquet de Lemos, 2004.
MORAIS, Edison Andrade Martins; AMBRSIO, Ana Paula L.. Ontologias: conceitos, usos, tipos, metodologias, ferramentas e linguagens. Goinia: Instituto de Informtica/universidade Federal de Gois, 2007. 21 p. Disponvel em: <http://www.inf.ufg.br/sites/default/files/uploads/relatorios- tecnicos/RT-INF_001-07.pdf>. Acesso em: 02 ago. 2013.
OLIVEIRA, Carla Cristina Vieira de. A Interao dos Usurios da UFMG com o Catlogo online do Sistema Pergamum. Belo Horizonte, 2008. cap. 3. Disponvel em: <http://www.gercinalima.com/mhtx/pages/prototipo-btdeci/dissertacoes/oliveira-
ccv/cap.-3--os-sistemas-de-recuperacao-da-informacao.php>. ROBREDO, J. Documentao de hoje e amanh: uma abordagem informatizada de biblioteconomia e dos sistemas de informao. 2. ed. rev. ampl. Braslia: Edio de autor, 1994.
SALES, Rodrigo de; CAF, Lgia. Semelhanas e diferenas entre tesauros e ontologias. Data Grama Zero, v. 9, n. 4, ago. 2008. Disponvel em: < http://www.dgz.org.br/ago08/Art_02.htm>. Acesso em: 02 ago. 2013
SANTOS, Viviane Neves dos titulo: Indexao automtica de documentos textuais: iniciativas dos grupos de pesquisa de universidades pblicas brasileiras. So Paulo, p. 24-23, 2009. Disponvel em: <http://rabci.org/rabci/sites/default/files/Viviane_Neves_TCC_final.pdf>. Acesso em: 07 ago. 2013.
SMIT, J. W. A informao na Cincia da Informao. InCID: Revista de Cincia da Informao e Documentao, Ribeiro Preto, v. 3, p. 84-101, jul./dez. 2012.
SOUZA, R.R. Sistemas de recuperao da informao e mecanismos de busca na Web. Perspectivas em Cincia da Informao, Belo Horizonte, v. 11, n. 2, p. 161- 173, maio/ago. 2006.
VALE, E. A. Linguagens de indexao. In: SMIT, J. W. Anlise documentria: a anlise da sntese. Braslia: IBICT, 1987. p.11-26.
WORLD INFORMATION SYSTEM FOR SCIENCE AND TECHNOLOGY. Princpios de indexao. R. esc. Bibliotecon. UFMG, v.10, n. 1, p. 83-94, 1981. Disponvel em: <www.brapci.ufpr.br/download.php?dd0=15948>. Acesso em: 7 ago. 2013.
Re-identificação de pessoas em múltiplas câmeras por meio de imagens digitais: estudo de caso: análise e avaliação do estado da arte na re-identificação de pessoas em múltiplas câmeras