我从不同来源(手机本地,谷歌驱动器等)获取PDF的URI,而对于Dropbox,我可以使用URI作为输入读取字节数组。但是我得到的PDF不是有效的PDF。 Base64也不正确。
这是我的URI:
内容://com.dropbox.android.FileCache/filecache/a54cc030-e2e0-4ef5-8e72-0ac3269a16e1
val inputStream = context.contentResolver.openInputStream(Uri.parse(uri))
val allText = inputStream.bufferedReader().use(BufferedReader::readText)
val base64Image = Base64.encodeToString(allText.toByteArray(), Base64.DEFAULT)
allText内容(片段):
%PDF-1.3
%���������
4 0 obj
<< /Length 5 0 R /Filter /FlateDecode >>
.
.
.
13025
%%EOF
使用.PDF扩展名存储allText内容时不起作用。
格式看起来不错,但是当在https://base64.guru/converter/decode/pdf中插入base64Image时,它表明它不正确。
原始PDF内容(摘要):
2550 4446 2d31 2e33 0a25 c4e5 f2e5 eba7
f3a0 d0c4 c60a 3420 3020 6f62 6a0a 3c3c
.
.
.
.
0a73 7461 7274 7872 6566 0a31 3330 3235
0a25 2545 4f46 0a
- “我可以使用URI作为输入读取字节数组。但是我得到的PDF不是有效的PDF。”
- “使用.PDF扩展名存储
allText
内容时不起作用。”
您正在读取PDF输入字节(十六进制)并将其存储为错误的格式(文本)。
例如,所有有效的PDF文件都应以字节25 50 44 46
开头。您的allText
内容片段以%PDF
开头,input bytes : 25 50 44 46
as text : % P D F
into bytes : 25 50 44 46
是这些字节的转换后的ASCII / UTF文本表示形式。
问题: 这一切都很好,因为我们可以将文本字符转换回各自的字节值,对吧?不,不是所有字节值都可以从文本格式中正确恢复。
示例#1:可以转换...
input bytes : 25 C4 E5 F2 E5 EB A7 F3 A0 D0
as text : % � � � � � � � � �
into bytes : 25 00 00 00 00 00 00 00 00 00
示例#2:无法转换(原始数据未恢复,因为此类字节没有文本字符)...
import java.io.File
import java.io.InputStream
fun main(args: Array<String>)
{
//# setup access to your file...
var inFile :InputStream = File("your-file-path-here.pdf")
var fileSize :Int = File(path).length()
//# read file bytes into a bytes Array...
var inStream :InputStream = inFile.inputStream()
var inBytes :ByteArray = inStream.readBytes()
//# Make as String (of hex values)...
//var hexString :String = ""
val hexString = ""
for (b in inBytes) { hexString = String.format("%02X", b) }
//# check values as hex... should print: 25
//print(hexString) //could be long print-out for a big file
//# Make Base64 string...
val base64 = Base64.getEncoder().encodeToString(inBytes)
}
解:
尝试类似下面的内容。你想要代码注释中解释的逻辑......
hexString
“Base64也不正确。”
(选项1)
尝试在上面的示例代码中转换为Base64 val base64
(注意:现在添加为val bytes = File(filePath).readBytes()
val base64 = Base64.getEncoder().encodeToString(bytes)
)。
(选项2)
用简单的方法将文件字节直接读入Base64字符串......
val file = File(uri)
这是我的URI:
那不是文件。
Uri
这不是你如何使用ContentResolver
。使用openInputStream()
和InputStream
在Uri
识别的内容上获得OutOfMemoryErrors
。
请注意,读取整个内容,更不用说将其转换为内存中的Base64,可能会导致您遇到qazxswpoi。