மதிப்பிற்குரிய அய்யா,
என்னிடம் பிடிஎப் கோப்புகளை எழுத்துக் கோப்பாக மாற்றும் நிரல் கட்டளை திடிரென வேலை செய்யவில்லை. சரி செய்து தரமுடியுமா?
மதிப்பிற்குரிய அய்யா,
என்னிடம் பிடிஎப் கோப்புகளை எழுத்துக் கோப்பாக மாற்றும் நிரல் கட்டளை திடிரென வேலை செய்யவில்லை. சரி செய்து தரமுடியுமா?
தோழர், இவ்வளவு பார்மல் வேணாம், சாதாரணமாக வணக்கம் என்றே துவக்கலாமே?
என்னிடம் பிடிஎப் கோப்புகளை எழுத்துக் கோப்பாக மாற்றும் நிரல் கட்டளை திடிரென வேலை செய்யவில்லை. சரி செய்து தரமுடியுமா?
எந்த கட்டளையை இயக்கினீர்கள்? அதை இங்கே பகிரவும்.
நண்பரே, என்னுடைய நண்பர் எழுதியது - ஆறு வருடங்களுக்கு முன்னால். அதை நாளை அவரின் அனுமதி பெற்று அனுப்புகிறேன்.
நண்பர் மோகன் அவர்களுக்கு, இதோ இந்த இணைப்பில் உள்ளது. இதையே நான் பயன்படுத்தி வந்தேன் - தேவைப்படும்போதெல்லாம். இடையில், நின்று விட்டது. இதிலுள்ள அனைத்தும் நிறுவினேன் - ஆனால், json file கேட்கிறது. அது என்னவென்று தெரியவில்லை. GitHub - KaniyamFoundation/Pdf2Text: Project to convert PDF files to Text files using google OCR
இரண்டாவது பிரச்சனை: அதிலுள்ள செட்டப்.எச் என்ற கட்டளையை தந்தவுடன், பிடிஎப் ஸ்கரேப்பர் என்பதை நிறுவ முடியவில்லை. மற்றவைகள் லினக்ஸ்- உபுண்டு-(24_எல்_டி_ஸ்) -ல் ஏற்கப்பட்டன.
GitHub - KaniyamFoundation/Pdf2Text: Project to convert PDF files to Text files using google OCR
API setup ல் உள்ளபடி செய்து credentials json ஐப் பதிவிறக்கம் செய்க.
setup.sh ஐ இயக்கும் போது ஏற்படும் பிழைச் செய்திகளைப் பகிர்க.
பில்லிங் பகுதியில் கூகுள் கீழ்க்கண்ட தகவல்களை கேட்கிறது. தரலாமா? What you’ll need for verification
You’ll need a mobile phone to verify it’s really you
An ID to verify it’s really you
Accepted documents include:
Aadhaar cards are not accepted
You’ll need a document showing your name and current address
Accepted documents include:
If your government ID has an address, you can upload the same document for proof of address.
Aadhaar cards are not accepted
உங்களின் அறிவுரையின் படி, வரிக்கு வரி படித்து, நானே முயற்சி செய்தேன். ஜேஎஸென் கூகுளிலிருந்து கோப்பு கிடைத்தது. அதை செய்தால், முதல் பக்கத்திற்கு சென்று, இவ்வாறு தகவல் தருகிறது.
Access blocked: pdf2text has not completed the Google verification
process
ganesanambedkar@gmail.com
pdf2text has not completed the Google verification process. The app is currently being tested, and can only be accessed by developer-approved testers. If you think you should have access, contact the developer.
If you are a developer of pdf2text, see error details.
Error 403: access_denied
செட்-அப்.எச் - கட்டளையால் எந்த சிக்கலும் எழவில்லை.
எல்லா பிரச்சனைகளையும் தீர்த்து விட்டேன். கணினி மொழியை புரிந்து கொள்ள தாமதம் ஆனது. இப்போது வேலை செய்கிறது.
மதிப்பிற்குரிய சீனிவாசன் அவர்களுக்கு,
திடீரென கீழ்க்கண்ட தகவல்களுடன் நிரல்கட்டளை வெளியேறிவிட்டது. கீழே யுள்ளதை கவனிக்கவும்:
.1
INFO:main:Running pdf2text.py 1.1
INFO:googleapiclient.discovery_cache:file_cache is only supported with oauth2client<4.0.0
INFO:oauth2client.transport:Refreshing due to a 401 (attempt 1/2)
INFO:oauth2client.client:Refreshing access_token
INFO:main:Input Folder name = input
INFO:main:Output Folder name = output
INFO:main:Columns = 1
Search at input
INFO:main:File Type = pdf
INFO:main:Created Temp folder OCR-Tamilnadu_State_Autonomy_Resolution_1974_a4.pdf-temp-2024-09-23-14-53-14
INFO:root:Spliting the PDF file
INFO:root:qpdf --split-pages=20 input/Tamilnadu_State_Autonomy_Resolution_1974_a4.pdf OCR-Tamilnadu_State_Autonomy_Resolution_1974_a4.pdf-temp-2024-09-23-14-53-14/pg_%d.pdf
INFO:main:
uploading OCR-Tamilnadu_State_Autonomy_Resolution_1974_a4.pdf-temp-2024-09-23-14-53-14/pg_01-20.pdf to google. 1/1
{‘name’: ‘OCR-Tamilnadu_State_Autonomy_Resolution_1974_a4.pdf-temp-2024-09-23-14-53-14/pg_01-20.pdf’, ‘mimeType’: ‘application/vnd.google-apps.document’, ‘parents’: [‘1QqIxjjOH0KjXTeOeAxgMgTOO7lHaFodL’]}
<googleapiclient.http.MediaFileUpload object at 0x71c0f47d47d0>
Redirected but the response is missing a Location: header.
Traceback (most recent call last):
File “/home/ubuntu/pdf2text/pdf2text.py”, line 366, in prepare_file
do_ocr(pdf_file, temp_folder)
File “/home/ubuntu/pdf2text/pdf2text.py”, line 288, in do_ocr
status, response = Imgfile.next_chunk()
^^^^^^^^^^^^^^^^^^^^
File “/usr/local/lib/python3.12/dist-packages/googleapiclient/_helpers.py”, line 130, in positional_wrapper
return wrapped(*args, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^
File “/usr/local/lib/python3.12/dist-packages/googleapiclient/http.py”, line 1084, in next_chunk
resp, content = http.request(
^^^^^^^^^^^^^
File “/home/ubuntu/.local/lib/python3.12/site-packages/oauth2client/transport.py”, line 173, in new_request
resp, content = request(orig_request_method, uri, method, body,
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File “/home/ubuntu/.local/lib/python3.12/site-packages/oauth2client/transport.py”, line 280, in request
return http_callable(uri, method=method, body=body, headers=headers,
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File “/home/ubuntu/.local/lib/python3.12/site-packages/httplib2/init.py”, line 1724, in request
(response, content) = self._request(
^^^^^^^^^^^^^^
File “/home/ubuntu/.local/lib/python3.12/site-packages/httplib2/init.py”, line 1467, in _request
raise RedirectMissingLocation(
httplib2.error.RedirectMissingLocation: Redirected but the response is missing a Location: header.
Text files are not equal to JPG files. Some JPG files not OCRed. Run this script again to complete OCR all the JPG files
INFO:main:
=========ERROR===========
INFO:main:
Text files are not equal to PDF files. Some PDF files not OCRed. Run this script again to complete OCR all the PDF files
list index out of range
Traceback (most recent call last):
File “/home/ubuntu/pdf2text/pdf2text.py”, line 516, in
prepare_file(source_file, 1)
File “/home/ubuntu/pdf2text/pdf2text.py”, line 319, in prepare_file
input_filename = source_file.split(input_folder+“/”)[1]
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~^^^
IndexError: list index out of range
இன்புட் பைல், எரர் ஒண் என்ற டிரக்கடரியில் உள்ளது. அவுட்புட் டிடக்கடரியில் ஒன்றுமில்லை.
மீண்டும் ஒரு முறை இயக்கிப் பாருங்கள்.