చేతిరాత గుర్తింపు
This article may require cleanup to meet Wikipedia's quality standards. The specific problem is: భాష కృత్రిమంగా ఉంది. (నవంబర్ 2020) |
చేతిరాత గుర్తింపు (HWR), also known as చేతితో రాసిన టెక్స్ట్ గుర్తింపు (HTR) ఇది పేపర్ డాక్యుమెంట్ లు, ఫోటోగ్రాఫ్ లు, టచ్ స్క్రీన్ లు , ఇతర పరికరాల నుంచి చేతిరాత ఇన్ పుట్ ని అందుకోవడం , చేతివ్రాత గుర్తింపు అనేది చేతితో రాసిన ఇన్పుట్ను గుర్తించి, అర్థం చేసుకోగల కంప్యూటర్ సామర్థ్యం. దీనిని కొన్నిసార్లు ‘చేతితో రాసిన వచన గుర్తింపు’ అంటారు.[1] భాష్యం చెప్పే కంప్యూటర్ యొక్క సామర్థ్యం.వ్రాతపూర్వక వచనం యొక్క చిత్రం ఆప్టికల్ స్కానింగ్ (ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్) లేదా ఇంటెలిజెంట్ వర్డ్ రికగ్నిషన్ ద్వారా కాగితం ముక్క నుండి "ఆఫ్ లైన్" గా గ్రహించబడుతుంది. ప్రత్యామ్నాయంగా, పెన్ చిట్కా యొక్క కదలికలు "లైన్" లో గ్రహించబడతాయి, ఉదాహరణకు పెన్-ఆధారిత కంప్యూటర్ స్క్రీన్ ఉపరితలం ద్వారా, ఎక్కువ ఆధారాలు అందుబాటులో ఉన్నందున ఇది సాధారణంగా సులభమైన పని. ఇందులో చేతివ్రాత గుర్తింపు వ్యవస్థ ఆకృతీకరణను నిర్వహిస్తుంది, సరైన విభజనను అక్షరాలుగా చేస్తుంది , చాలా వరకు సరిఅయిన ఆమోదయోగ్యమైన పదాలను కనుగొంటుంది.చేతితో రాసిన టెక్ట్స్ ని గుర్తించడం అనేది ఇంటెలిజెంట్ క్యారెక్టర్ రికగ్నిషన్(ICR)గా పేర్కొనబడుతుంది, ఎందుకంటే ఐసిఆర్ పరిష్కరించడానికి అవసరమైన అల్గారిథమ్ లు జనరిక్ OCRని పరిష్కరించడం కంటే మరింత తెలివితేటలు అవసరం అవుతాయి.[2]చేతివ్రాత గుర్తింపును ఇన్పుట్ పద్దతిగా చూడటం ప్రజలకు అలవాటు అయినప్పటికీ, డెస్క్టాప్ లేదా నోట్బుక్ కంప్యూటర్లలో ఇది విస్తృతంగా ఉపయోగించబడలేదు. కీబోర్డ్ ఇప్పటికీ వేగంగా, నమ్మదగిన ఇన్పుట్ పద్ధతిగా విస్తృతంగా పరిగణించబడుతుంది.
చేతివ్రాత గుర్తింపులో రెండు రకాలు ఉన్నాయి. మొదటిది రెండింటిలో పాతది, దీనిని ఆఫ్లైన్ చేతివ్రాత గుర్తింపు అంటారు.
ఇక్కడే చేతితో రాసిన ఇన్పుట్ స్కాన్ చేయబడి లేదా ఫోటో తీయబడి కంప్యూటర్కు ఇవ్వబడుతుంది.
రెండవది ఆన్లైన్, ఇక్కడే స్టైలస్ / టచ్స్క్రీన్ ద్వారా రచన ఇన్పుట్ అవుతుంది.
ఆఫ్ లైన్ గుర్తింపు
[మార్చు]ఆఫ్ లైన్ హ్యాండ్ రైటింగ్ గుర్తింపులో ఒక ఇమేజ్ లోని టెక్ట్స్ ని లెటర్ కోడ్ లుగా ఆటోమేటిక్ గా మార్చడం , కంప్యూటర్ , టెక్ట్స్ ప్రాసెసింగ్ అప్లికేషన్ ల్లో ఇది ఉంటుంది. ఈ ఫారం ద్వారా పొందిన డేటా చేతివ్రాత యొక్క స్థిర ప్రాతినిధ్యంగా పరిగణించబడుతుంది. వేర్వేరు వ్యక్తులు వేర్వేరు చేతివ్రాత శైలులను కలిగి ఉన్నందున ఆఫ్లైన్ చేతివ్రాత గుర్తింపు చాలా కష్టం. ,, నేటి వరకు, OCR ఇంజిన్లు ప్రధానంగా మెషిన్ ప్రింటెడ్ టెక్ట్స్ , చేతి "ప్రింటెడ్" (క్యాపిటల్ లెటర్స్ లో రాయబడ్డ) టెక్ట్స్ కొరకు ఐ.సి.ఆర్.
అక్షర సంగ్రహణ
[మార్చు]ఆఫ్లైన్ అక్షర గుర్తింపు తరచుగా వ్రాసిన రూపం లేదా పత్రాన్ని స్కాన్ చేస్తుంది. స్కాన్ చేసిన చిత్రంలో ఉన్న వ్యక్తిగత అక్షరాలను సంగ్రహించాల్సిన అవసరం ఉందని దీని అర్థం. ఈ దశను చేయగల సాధనాలు అందుబాటులో ఉన్నాయి. అయితే, ఈ దశలో అనేక లోపాలు ఉన్నాయి. కనెక్ట్ చేయబడిన అక్షరాలను రెండు అక్షరాలతో కూడిన ఒకే ఉప-చిత్రంగా తిరిగి ఇవ్వడం చాలా సాధారణం. గుర్తింపు దశలో ఇది పెద్ద సమస్యను కలిగిస్తుంది. కనెక్ట్ చేయబడిన అక్షరాల ను సరిగా నిర్దారించటానికి అనేక అల్గోరిథంలు అందుబాటులో ఉన్నాయి.
అక్షర గుర్తింపు
[మార్చు]వ్యక్తిగత అక్షరాలను వేరు చేసిన తరువాత, అనుబంధ కంప్యూటర్ అక్షరాన్ని గుర్తించడానికి ఒక గుర్తింపు ఇంజిన్ ఉపయోగించబడుతుంది. అనేక విభిన్న గుర్తింపు పద్ధతులు ప్రస్తుతం అందుబాటులో ఉన్నాయి.
ఆన్-లైన్ గుర్తింపు
[మార్చు]ఆన్-లైన్ చేతివ్రాత గుర్తింపుకు రాసేటప్పుడు రచనను రికార్డ్ చేయడానికి టచ్ స్క్రీన్ లేదా ఇతర డిజిటల్ పరికరం అవసరం. వేళ్లు లేదా ఇన్పుట్ పెన్నులు లేదా గ్రాఫిక్స్ టాబ్లెట్లతో కూడిన స్మార్ట్ఫోన్లు, టాబ్లెట్లు వంటి అనేక రకాల ఇన్పుట్ పరికరాలను ఉపయోగించవచ్చు. ఈ ఇన్పుట్ పరికరాలు ఇన్పుట్ పెన్ ఎక్కడ ఉందో దాని గురించి సమాచారాన్ని అందిస్తుంది. కొన్ని పరికరాలు పెన్ టచ్స్క్రీన్లో లేనప్పటికీ, దాని పైన ఉన్నప్పటికీ ఈ సమాచారాన్ని అందిస్తాయి. ఉపయోగించిన సాంకేతికతను బట్టి ఇన్పుట్ యొక్క కోఆర్డినేట్లు ఎంత ఒత్తిడి తెచ్చాయో కూడా సమాచారాన్ని అందించాయి.ప్రీప్రాసెసింగ్ యొక్క ఉద్దేశ్యం అసంబద్ధమైన ఇన్పుట్ డేటాను విస్మరించడం, ఇది ప్రతికూల ప్రభావాన్ని తగ్గిస్తుంది. ఇందులో వేగం, ఖచ్చితత్వం ఉంటాయి. ఇది సాధారణంగా ఇమేజ్ బైనరైజేషన్ , నార్మలైజేషన్, శాంప్లింగ్, స్మూతీంగ్, డెనోయిజింగ్ ప్రిప్రాసెసింగ్ కలిగి ఉంటుంది.
ఒక వ్యక్తి నుంచి స్ట్రోక్ ల యొక్క భారీ వైవిధ్యం , సందిగ్ధత ఉంటుంది
ఒక వ్యక్తి యొక్క చేతిరాత శైలి కూడా కాలానుగుణంగా మారుతూ ఉంటుంది , అస్థిరంగా ఉంటుంది.
కాలక్రమేణా డీగ్రేడేషన్ వల్ల సోర్స్ డాక్యుమెంట్/ఇమేజ్ యొక్క నాణ్యత సరిగ్గా లేకపోవడం వలన ఇబ్బంది
ప్రింట్ చేయబడ్డ డాక్యుమెంట్ ల్లో టెక్ట్స్ ఒక సరళరేఖలో ఉంటుంది, అయితే మానవులు తెల్లకాగితంపై సరళరేఖలో టెక్ట్స్ ని రాయాల్సిన అవసరం లేదు.
కలిపి రాతలో అనేది క్యారెక్టర్లను వేరు చేయడం , గుర్తించడం సవాలుగా ఉంటుంది
చేతిరాతలోని టెక్ట్స్ కు కుడివైపున వేరియబుల్ రొటేషన్ ఉంటుంది, ఇది ప్రింట్ చేయబడ్డ టెక్ట్స్ కు విరుద్ధంగా ఉంటుంది, ఇక్కడ అన్ని టెక్ట్స్ తిన్నగా ఉంటుంది.
రాబోయే పరిష్కారాలు
[మార్చు]చేతితో రాసిన పత్రాలు , సందేశాలను గుర్తించడానికి , డిజిటలైజ్ చేయడానికి కంప్యూటర్లు, తెలుసుకోవడానికి చాలా సాంకేతిక వ్యవస్థలు ఉన్నాయి. విభిన్న అక్షరాలు, అక్షరాలు , అంకెలు తెలుసుకొటానికి చాలా లోతైన అభ్యాసం (డీప్ లెర్నింగ్) అవసరం అవుతుంది, విభిన్న చేతివ్రాత శైలుల కారణంగా తేడాలు ఉన్నప్పటికీ వాటిని గుర్తించగల లోతైన అభ్యాసం neural networks , న్యురల్ నెట్వర్క్లు వస్తున్నాయి. లోతైన అభ్యాసం యంత్రాలను కాలక్రమేణా నేర్చుకోవడానికి వేర్వేరు చేతివ్రాత ఉన్నప్పటికీ అక్షరాలను ఎలా గుర్తించాలో యంత్రం నేర్చుకోవచ్చు
మూలాలు
[మార్చు]- ↑ "Why is handwriting recognition so difficult for AI?". ThinkAutomation (in బ్రిటిష్ ఇంగ్లీష్). 2020-07-07. Archived from the original on 2020-11-01. Retrieved 2020-10-30.
- ↑ "How to easily do Handwriting Recognition using Deep Learning". AI & Machine Learning Blog (in ఇంగ్లీష్). 2020-09-16. Retrieved 2020-10-30.