Foreversoft.ru

IT Справочник
1 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Pdf to word linux

Конвертируем PDF в текстовый файл в Linux

Есть множество различных причин, почему вам нужно конвертировать PDF файл в редактируемый текстовый файл, мы здесь не будем обсуждать причины, но обсудим способ как это можно осуществить в Linux. Возможно, вам нужно посмотреть(изменить) старый документ, но у вас есть лишь PDF версия. Преобразовать PDF файл в Windows, очень легко, но что делать, если вы используете Linux? Думаю этим вопросом задавались многие.

Не стоит беспокоиться. Мы покажем вам, как очень быстро и легко конвертировать PDF файлы в редактируемый текст с помощью инструмента командной строки(терминал) с помощью пакета под названием pdftotext, что является частью утилиты «Poppler-Utils». Этот инструмент может быть уже установлен по умолчанию в системе. Чтобы проверить, установлен ли в вашей системе pdftotext, нажмите «Ctrl + Alt + T», чтобы открыть окно терминала. Введите следующую команду в командной строке и нажмите клавишу «Enter».

Если пакет установлен, хотя должен быть установлен так как проверив в версии Ubuntu 14.04 LTS мы видим следующий текст который нам сообщает, что пакет уже установлен в системе:

Package: poppler-utils
Status: install ok installed
Priority: optional
Section: utils
Installed-Size: 432
Maintainer: Ubuntu Developers
Architecture: i386
Multi-Arch: foreign
Source: poppler
Version: 0.24.5-2ubuntu4
Replaces: pdftohtml, xpdf-reader, xpdf-utils ( = 2.4), libcairo2 (>= 1.12.0), libfreetype6 (>= 2.2.1), libgcc1 (>= 1:4.1.1), liblcms2-2 (>= 2.2+git20110628), libpoppler44 (>= 0.24.5), libstdc++6 (>= 4.1.1)
Breaks: xpdf-utils (

1. В том случае если оказалось, что в вашей версии дистрибутива пакет pdftotext не установлен, введите следующую команду в командной строке и нажмите клавишу «Enter».

sudo apt-get install poppler-utils

  • В утилите Poppler-Utils есть несколько инструментов, которые позволяют конвертировать PDF в другие форматы, манипулируя PDF файлами, и извлекая информацию из файлов.

2. Для примера, давайте представим, что у нас в домашней директории имеется файл с названием Book.pdf, какую команду в нашем случае нужно выполнить чтобы преобразовать данный файл в файл текстового формата для чтения и редактирования например с помощью текстового редактора Gedit или любого другого.

  • Ниже приводится пример основной команды которая используется для преобразования PDF-файла в редактируемый текстовый файл. Нажмите «Ctrl + Alt + T», чтобы открыть окно терминала, далее введите следующую команду в командной строке и нажмите клавишу «Enter».

pdftotext /home/linux/Документы/Book.pdf /home/linux/Документы/Book.txt

В нашем случае linux это моя учетная запись, вы изменяйте на вашу, далее файл Book.pdf с которым мы и проводим опыты, далее через пробел мы так же прописываем путь в ту же директорию где нам создать готовый текстовый файл с результатом конвертации.

В моем случае я забросил в папку документы простенький документ почти на 3 метра, справочник по HTML, далее выполняю команду:

pdftotext CSS Manual.pdf CSS Manual.txt

  • Мы имеем готовый текстовый файл результат конвертирования с формата pdf. Конечно очень важно в вашем случае прописать полный и правильный путь к файлу который необходимо конвертировать, чтобы соответствовать расположению и имени вашего оригинального PDF файла и где вы хотите сохранить полученный текстовый файл. Так же не забываем о волшебной клавише под названием Tab при вводе пути и названия файла, убережет ваше время и автоматически подберется тот путь и то название файла которое нужно.
Читать еще:  Zyxel keenetic password

3. Конечно готовый преобразованный текст может иметь разрывы строк которых вы возможно и не хотите как и я. Разрывы строк вставляются после каждой строки текста в файле PDF. Чтобы убрать разрывы и лишнюю табуляцию, мы можем сохранить макет нашего pdf документа (заголовки и многое другого) от оригинального PDF файла в текстовом файле преобразовав с помощью специального флага «-layout».

В итоге готовая команда уже будет иметь следующий вид:

pdftotext -layout /home/linux/Документы/Book.pdf /home/linux/Документы/Book.txt

проверив результаты конвертации, скажу честно, уже все намного в более порядочном виде, но все же имеется много мелочей которые необходимо отредактировать.

4. Вам нужно преобразовать не целый документ, а определенный диапазон страниц от и до, например с 10 по 100, как будет смотреться готовая команда для конвертации спросите вы. Нажмите «Ctrl + Alt + T», чтобы открыть окно терминала, далее введите следующую команду в командной строке и нажмите клавишу «Enter».

pdftotext -f 10 -l 100 /home/linux/Документы/Book.pdf /home/linux/Документы/Book.txt

5. Как преобразовать PDF файл который зашифрован паролем от владельца спросите вы? Решение данного вопроса так же имеется и имеет следующую готовую комбинацию:

pdftotext -0pw ‘пароль’ /home/linux/Документы/Book.pdf /home/linux/Документы/Book.txt

  • Чтобы вы не попутали при возможном выполнении команды выше, в атрибуте 0pw используется не буква О, а цифра ноль.

6. Как преобразовать файл который защищен паролем, не зашифрован как в варианте выше, так же имеется простое решение, в терминале выполняем готовую комбинацию, пример:

pdftotext -upw ‘пароль’ /home/linux/Документы/Book.pdf /home/linux/Документы/Book.txt

7. Вы можете также указать Тип конца строки, символ, который добавляется в преобразованный текст. Это особенно полезно, если вы планируете использовать файл в разных операционных системах, таких как Windows или Mac. Чтобы сделать это, используйте флаг «-eol» (символ в середине флага является строчной буквой «o», не ноль), затем пробел и указываем окончания для строк который вы хотите использовать («Unix», «Dos», или «Mac»).

  • Готовая команда будет иметь следующий вид, Нажмите «Ctrl + Alt + T», чтобы открыть окно терминала, далее введите следующую команду в командной строке и нажмите клавишу «Enter».

pdftotext -eol unix /home/linux/Документы/Book.pdf /home/linux/Документы/Book.txt

Если вам мало информации по возможности преобразования pdf документов в разнообразные форматы, вы всегда можете прочесть справку, выполнив в терминале команду — man pdftotext. На этом пожалуй материал завершен, если у вас будут вопросы, пожалуйста, спрашивайте в комментариях к материалу ниже, всем удачи.

Читать еще:  Как создать визитки в word

The Best 3 Ubuntu PDF to Word Converter Tools

Ivan Cook

Sep 03,2019 • Filed to: PDF Converter

PDF is an open standard document format that is easily accessible by many users across different devices. It was created by Adobe so that files can be consistent on all platforms. You can easily convert PDF to Word on Windows or Mac, but it is little difficult for those who use Ubuntu to convert PDF to Word. If you need to convert PDF to Word on Ubuntu to copy PDF content for future use or modify PDF text, you will need an Ubuntu PDF to Word converter. Below are the three best solutions for you. For a converter tool that works across both Windows and Mac, PDFelement Pro could be a great choice.

Top 3 Ubuntu PDF to Word Converters

1. LibreOffice

LibreOffice provides a clean interface and feature-rich tools which helps to enhance your productivity. With the new version of this PDF converter, you can enjoy functions of Calibre for image handling. Plus, most open source office suits are available: Writer (word processing), Calc (spreadsheets), Impress (presentations), Draw (vector graphics and flowcharts), Base (databases), and Math (formula editing).

  • You can edit letters, faxes, agendas and minutes, and perform more complex tasks quickly such as mail merges, etc.
  • Prov >

2. Okular

Okular is a free, open-source PDF to Word converter for Ubuntu. This software enables you to read PDF files, Postscript, DjVu, CHM, and more. Okular is a universal document viewer developed by KDE. It works on multiple platforms, including but not limited to Linux, Windows, Mac OS X, *BSD, and more. Recently, the 1.6 version of Okular was released together with KDE Applications 18.12 release. You can now enjoy the new version for free.

  • Supports PDF, Postscript, DjVu, CHM, XPS, ePub and others formats.
  • You can add comments, highlights, drawing tools, geometric shapes, textboxes, and stamps to your PDF files.

3. PDF Studio

PDF Studio is an all-in-one, easy-to-use PDF editor which provides all the necessary PDF functions. With this Ubuntu PDF software, you can perform OCR on PDFs, create PDFs, Batch Process Multiple PDFs and more. It is a very popular alternative to Adobe Acrobat, because it’s an affordable and full-featured software.

  • Supports all platform: Windows, Mac, and Linux.
  • You can move, resize, and save images.
  • Import and export form data in FDF / XFDF / XDP formats.

Recommend an Alternative Ubuntu PDF to Word Converter — PDFelement Pro

PDFelement ProPDFelement Pro is a great alternative Ubuntu PDF to Word Converter for Windows and Mac. It’s the safest PDF to Word converter that comes with unique features which are helpful in the creation, editing, and conversion of PDF files. Plus you can match the look and layout of the original content. It gives you full control of your PDF files by using a variety of editing options that allows you to change backgrounds, delete, rotate, crop, split, combine, or insert pages, and add watermarks, extract data, and explore your PDF document completely.

Steps to Convert PDF to Word

Step 1. Run the PDF editor and import PDF files

Download PDF to Word converter on your desktop and launch it by double-clicking the icon which is located on your desktop background. Click the «Convert PDF» button or «Open File» button to open the PDF file you want to convert; you can add as many PDF files as you wish, since the software supports multiple conversions.

Step 2. Choose Your Output Format

Word is the software’s default output format. If you would like to convert PDF documents to any other format, you can change the default setting according to your preference. You can also choose your output folder to easily locate the Word document after conversion.

Step 3. Start converting PDF to Word

You will have the opportunity to choose to convert some or all of the pages of your PDF documents. Choose «To Word» on the tool bar, and select a folder to save your converted PDF to Word file to so you can start the conversion process. The converted file will be readable and editable in text editing applications such as Microsoft Word.

PDFelement ProPDFelement Pro is the ultimate multipurpose solution for basic as well as advanced file management needs at your office. With this program, you can enjoy creating, editing, or converting PDF documents effortleslly. Plus, it’s easy to use, even for beginners. Once you start using this alternative to Ubuntu PDF Converter, you will realize that it is indeed a great investment for you or your company.

Ссылка на основную публикацию
Adblock
detector