7.7/10 (30 أصوات )

PDFTextStream المشروع هو النص الشعبي والفوقية لاستخراج مكتبة جافا ، بيثون ، و. NET.It تؤيد جميع نسخ من وثائق المواصفات الشعبي ، (بما في v1.6 ، يستخدمها البهلوان 7) ، واستخراج النص المشفرة باستخدام مزدوجة البايت مجموعات الأحرف (بما فيها الصينية واليابانية ، والكورية) ، والتشفير 40 بت و 128 بت تشفير الوثائق ، واستخراج وثيقة من وثائق جميع الفوقية التي تقدمها الشعبي الوثائق (بما في شكل بيانات ، والعناوين ، وشروحه). من السهل الاندماج في جاكرتا Lucene مدرج. الاحتياجات : اباتشي Lucene ما الجديد في هذا الإصدار : [سجل التغيير قراءة كاملة] ويضيف هذا الإصدار لدعم XFA أشكال استخراج البيانات في صيغة إكس. ذلك إلى حد كبير في تحسين أداء استخراج النص باستخدام VisualOutputTarget. الدعم الشعبي للالوثائق أكبر من 2GB. وهناك تحديد لعلة فيها جزءا لا يتجزأ من ترميزات Type1 الخطوط كانت لا تطبق بشكل صحيح في بعض الظروف. وهناك تحديد لهذه المشكلة حيث الأحدث في تحديث محتوى الوثائق الشعبي في بعض الأحيان يتم تجاهلها. ورطة لPDFDocEncoding مشكلة حيث المشفرة بين العناوين الفوقية وعدم فك الشفرة بشكل صحيح. ألف. getDestinationName () في طريقة com.snowtide.pdf.Bookmark.



  • مرات التنزيل: 372
  • متطلبات التشغيل:
  • الحجم: Array
  • الترخيص:
  • الاصدار : PDFTextStream
  • اضيف في: 2009-07-01 00:00:00
  • اخر تحديث: 23/06/2006
  • الموقع علي الانترنت:






Description



PDFTextStream project is a PDF text and metadata extraction library available for Java, Python, and .NET.It supports all versions of the PDF document specification, (including v1.6, used by Acrobat 7), extraction of text encoded using double-byte character sets (including Chinese, Japanese, and Korean), decryption of 40-bit and 128-bit encrypted documents, and extraction of all document metadata provided by PDF documents (including form data, bookmarks, and annotations). Easy integration with Jakarta Lucene is included. Requirements:

· Apache Lucene
What's New in This Release: [ read full changelog ]

· This release adds support for extracting XFA forms data as XML.
· It significantly improves the performance of text extraction using VisualOutputTarget. Support for PDF documents larger than 2GB.
· A fix for a bug where the encodings from embedded Type1 fonts were previously not being applied properly in some circumstances.
· A fix for a problem where newer content in updated PDF documents was sometimes being ignored.
· A fix for a problem where PDFDocEncoding-encoded bookmarks and metadata were not being decoded properly.
· A .getDestinationName() method in com.snowtide.pdf.Bookmark.








التعليقات علي PDFTextStream 2.2.5
اضافة تعليق

تعليقات الفيسبوك

تعليقات الموقع