பிடிஎப் கோப்புகளை எழுத்துக்களாக மாற்றுவது பற்றிய நிரல் கட்டளை வேலை செய்வதில்லை

மதிப்பிற்குரிய அய்யா,

  என்னிடம் பிடிஎப் கோப்புகளை எழுத்துக் கோப்பாக மாற்றும் நிரல் கட்டளை  திடிரென வேலை செய்யவில்லை. சரி செய்து தரமுடியுமா?

தோழர், இவ்வளவு பார்மல் வேணாம், சாதாரணமாக வணக்கம் என்றே துவக்கலாமே?

என்னிடம் பிடிஎப் கோப்புகளை எழுத்துக் கோப்பாக மாற்றும் நிரல் கட்டளை திடிரென வேலை செய்யவில்லை. சரி செய்து தரமுடியுமா?

எந்த கட்டளையை இயக்கினீர்கள்? அதை இங்கே பகிரவும்.

நண்பரே, என்னுடைய நண்பர் எழுதியது - ஆறு வருடங்களுக்கு முன்னால். அதை நாளை அவரின் அனுமதி பெற்று அனுப்புகிறேன்.

நண்பர் மோகன் அவர்களுக்கு, இதோ இந்த இணைப்பில் உள்ளது. இதையே நான் பயன்படுத்தி வந்தேன் - தேவைப்படும்போதெல்லாம். இடையில், நின்று விட்டது. இதிலுள்ள அனைத்தும் நிறுவினேன் - ஆனால், json file கேட்கிறது. அது என்னவென்று தெரியவில்லை. GitHub - KaniyamFoundation/Pdf2Text: Project to convert PDF files to Text files using google OCR

இரண்டாவது பிரச்சனை: அதிலுள்ள செட்டப்.எச் என்ற கட்டளையை தந்தவுடன், பிடிஎப் ஸ்கரேப்பர் என்பதை நிறுவ முடியவில்லை. மற்றவைகள் லினக்ஸ்- உபுண்டு-(24_எல்_டி_ஸ்) -ல் ஏற்கப்பட்டன.

@ganesan

GitHub - KaniyamFoundation/Pdf2Text: Project to convert PDF files to Text files using google OCR

API setup ல் உள்ளபடி செய்து credentials json ஐப் பதிவிறக்கம் செய்க.

setup.sh ஐ இயக்கும் போது ஏற்படும் பிழைச் செய்திகளைப் பகிர்க.

பில்லிங் பகுதியில் கூகுள் கீழ்க்கண்ட தகவல்களை கேட்கிறது. தரலாமா? What you’ll need for verification

You’ll need a mobile phone to verify it’s really you

  • You’ll receive a code on your mobile phone

An ID to verify it’s really you
Accepted documents include:

  • India passport
  • PAN card
  • Voter ID
  • Driver’s license
  • DigiLocker verified documents

Aadhaar cards are not accepted

You’ll need a document showing your name and current address
Accepted documents include:

  • Utility or phone bill (dated in the last 60 days)
  • Driver’s license
  • Voter ID
  • Indian passport last page

If your government ID has an address, you can upload the same document for proof of address.
Aadhaar cards are not accepted

உங்களின் அறிவுரையின் படி, வரிக்கு வரி படித்து, நானே முயற்சி செய்தேன். ஜேஎஸென் கூகுளிலிருந்து கோப்பு கிடைத்தது. அதை செய்தால், முதல் பக்கத்திற்கு சென்று, இவ்வாறு தகவல் தருகிறது.

Access blocked: pdf2text has not completed the Google verification

process
ganesanambedkar@gmail.com
pdf2text has not completed the Google verification process. The app is currently being tested, and can only be accessed by developer-approved testers. If you think you should have access, contact the developer.
If you are a developer of pdf2text, see error details.
Error 403: access_denied

செட்-அப்.எச் - கட்டளையால் எந்த சிக்கலும் எழவில்லை.

எல்லா பிரச்சனைகளையும் தீர்த்து விட்டேன். கணினி மொழியை புரிந்து கொள்ள தாமதம் ஆனது. இப்போது வேலை செய்கிறது.

மதிப்பிற்குரிய சீனிவாசன் அவர்களுக்கு,

  திடீரென கீழ்க்கண்ட தகவல்களுடன் நிரல்கட்டளை வெளியேறிவிட்டது. கீழே யுள்ளதை கவனிக்கவும்:

.1
INFO:main:Running pdf2text.py 1.1
INFO:googleapiclient.discovery_cache:file_cache is only supported with oauth2client<4.0.0
INFO:oauth2client.transport:Refreshing due to a 401 (attempt 1/2)
INFO:oauth2client.client:Refreshing access_token
INFO:main:Input Folder name = input
INFO:main:Output Folder name = output
INFO:main:Columns = 1
Search at input
INFO:main:File Type = pdf
INFO:main:Created Temp folder OCR-Tamilnadu_State_Autonomy_Resolution_1974_a4.pdf-temp-2024-09-23-14-53-14
INFO:root:Spliting the PDF file
INFO:root:qpdf --split-pages=20 input/Tamilnadu_State_Autonomy_Resolution_1974_a4.pdf OCR-Tamilnadu_State_Autonomy_Resolution_1974_a4.pdf-temp-2024-09-23-14-53-14/pg_%d.pdf
INFO:main:

uploading OCR-Tamilnadu_State_Autonomy_Resolution_1974_a4.pdf-temp-2024-09-23-14-53-14/pg_01-20.pdf to google. 1/1
{‘name’: ‘OCR-Tamilnadu_State_Autonomy_Resolution_1974_a4.pdf-temp-2024-09-23-14-53-14/pg_01-20.pdf’, ‘mimeType’: ‘application/vnd.google-apps.document’, ‘parents’: [‘1QqIxjjOH0KjXTeOeAxgMgTOO7lHaFodL’]}
<googleapiclient.http.MediaFileUpload object at 0x71c0f47d47d0>
Redirected but the response is missing a Location: header.
Traceback (most recent call last):
File “/home/ubuntu/pdf2text/pdf2text.py”, line 366, in prepare_file
do_ocr(pdf_file, temp_folder)
File “/home/ubuntu/pdf2text/pdf2text.py”, line 288, in do_ocr
status, response = Imgfile.next_chunk()
^^^^^^^^^^^^^^^^^^^^
File “/usr/local/lib/python3.12/dist-packages/googleapiclient/_helpers.py”, line 130, in positional_wrapper
return wrapped(*args, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^
File “/usr/local/lib/python3.12/dist-packages/googleapiclient/http.py”, line 1084, in next_chunk
resp, content = http.request(
^^^^^^^^^^^^^
File “/home/ubuntu/.local/lib/python3.12/site-packages/oauth2client/transport.py”, line 173, in new_request
resp, content = request(orig_request_method, uri, method, body,
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File “/home/ubuntu/.local/lib/python3.12/site-packages/oauth2client/transport.py”, line 280, in request
return http_callable(uri, method=method, body=body, headers=headers,
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File “/home/ubuntu/.local/lib/python3.12/site-packages/httplib2/init.py”, line 1724, in request
(response, content) = self._request(
^^^^^^^^^^^^^^
File “/home/ubuntu/.local/lib/python3.12/site-packages/httplib2/init.py”, line 1467, in _request
raise RedirectMissingLocation(
httplib2.error.RedirectMissingLocation: Redirected but the response is missing a Location: header.

Text files are not equal to JPG files. Some JPG files not OCRed. Run this script again to complete OCR all the JPG files

INFO:main:

=========ERROR===========

INFO:main:

Text files are not equal to PDF files. Some PDF files not OCRed. Run this script again to complete OCR all the PDF files

list index out of range
Traceback (most recent call last):
File “/home/ubuntu/pdf2text/pdf2text.py”, line 516, in
prepare_file(source_file, 1)
File “/home/ubuntu/pdf2text/pdf2text.py”, line 319, in prepare_file
input_filename = source_file.split(input_folder+“/”)[1]
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~^^^
IndexError: list index out of range

இன்புட் பைல், எரர் ஒண் என்ற டிரக்கடரியில் உள்ளது. அவுட்புட் டிடக்கடரியில் ஒன்றுமில்லை.

மீண்டும் ஒரு முறை இயக்கிப் பாருங்கள்.