inputStream 和 utf 8 有时显示“?”人物

2024-03-31

所以我已经处理这个问题一个多月了，我还通过谷歌检查了几乎所有可能的相关解决方案，但我找不到任何真正解决我的情况的东西。我的问题是我正在尝试从网站下载 html 源代码，但在大多数情况下我得到的是某些文本显示一些“？”其中的字符，很可能是因为该网站是希伯来语的。这是我的代码，

    public static InputStream openHttpGetConnection(String url)
            throws Exception {
        InputStream inputStream = null;
        HttpClient httpClient = new DefaultHttpClient();
        HttpResponse httpResponse = httpClient.execute(new HttpGet(url));
        inputStream = httpResponse.getEntity().getContent();
        return inputStream;

    }
    public static String downloadSource(String url) {
        int BUFFER_SIZE = 1024;

        InputStream inputStream = null;
        try {
            inputStream = openHttpGetConnection(url);
        } catch (Exception e) {
            // TODO: handle exception
        }
        int bytesRead;
        String str = "";
        byte[] inpputBuffer = new byte[BUFFER_SIZE];
        try {
            while ((bytesRead = inputStream.read(inpputBuffer)) > 0) {
                String read = new String(inpputBuffer, 0, bytesRead,"UTF-8");
                str +=read;

            }
        } catch (Exception e) {
            // TODO: handle exception
        }
        return str;

    }

Thanks.

要从给定编码的字节流中读取字符，请使用Reader。在你的情况下，它会是这样的：

    InputStreamReader isr = new InputStreamReader(inpputStream, "UTF-8");
    char[] inputBuffer = new char[BUFFER_SIZE];

    while ((charsRead = isr.read(inputBuffer, 0, BUFFER_SIZE)) > 0) {
        String read = new String(inputBuffer, 0, charsRead);
        str += read;
    }

您可以看到字节将直接作为字符读入——读者的问题是知道是否需要读取一个或两个字节，例如，在缓冲区中创建字符。这基本上是您的方法，但是在读入字节时进行解码，而不是在读入字节之后进行解码。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

UTF8

inputStream 和 utf 8 有时显示“?”人物的相关文章

Spring JDBC 模板。如何获取pl/sql脚本的结果变量

我正在使用 NamedParameterJdbcTemplate 来运行 pl sql 脚本但我不知道如何获取out变量的值 id out 提前致谢 String script declare begin if myFunc id in
在 portlet 中设置 SearchContainer 以使用 EL 和 JSTL 在 JSP 中使用它

我正在尝试使用SearchContainer在我的liferay应用程序中目前我必须使用 JSP Scriplets 来设置results in
我在使用 JavaFX 绘制十字时遇到问题

我正在尝试编写代码在网格上对角绘制 3 个形状前两个形状是正方形和圆形我能做到然而第三种形状让我有些悲伤我应该画一个十字 T 版本而不是 X 每次我写出代码时它看起来就像一个侧面我知道我只是错过了一些简单的东西但我真的很
Spring安全+LocaleResolver

我需要在身份验证成功后更改区域设置区域设置解析器
Hibernate 每个子类一个表继承策略的效率

我正在考虑 Hibernate 管理的类层次结构的表布局当然每个子类表技术在我看来是一般意义上最合适的然而通过逻辑思考我对其性能有些担忧尤其是随着子类数量的扩展举一个非常简短且经典的示例假设您有以下类 public ab
仅使用公钥在 HD 钱包中生成以太坊地址 (bitcoinj/web3j)

我尝试为使用 bitcoinj 库实现的 HD 钱包密钥生成以太坊地址但我感到困惑 DeterministicSeed seed new DeterministicSeed some seed code here null 1409478
始终等待页面加载到 PageObjects 上

因此当出现问题时我只是创建了一个简单的 selenium JBehave 代码我将首先发布简化的代码然后稍后解释我的问题是什么所以这里我们有一个简单的 AbstractClass 它将在我的 PageObjects 上继承此类仅
有没有办法让Maven自动下载快照版本？

所以我有一个项目依赖于另一个项目的快照版本依赖关系是
如何将日期字符串解析为Date？ [复制]

这个问题在这里已经有答案了如何将下面的日期字符串解析为Date object String target Thu Sep 28 20 29 30 JST 2000 DateFormat df new SimpleDateFormat E
Java 表达式树 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有相当于 net的 LINQ 下的表达式树JVM 我想实现一些类似 LINQ 的代码结构Scala
为什么不自动装箱泛型的 Java 基本类型？

Java 不允许在通用数据结构中使用原始类型例如不允许使用 ArrayList 原因是原始类型不能直接转换为Object 然而 Java 1 5 确实支持自动装箱并且包装类在通用数据结构中工作那么为什么编译器不能将其自动装箱到 A
我可以使用 Selenium Webdriver 测试元素的顺序吗？

有一个表单其中有 3 个字段具有 3 个不同的 ID fieldset div div fieldset
如何在 QueryDSL 中选择文字

我目前正在开发一个使用 queryDSL 和 hibernate 的项目其中它需要一个选择文字按照发布的示例here https stackoverflow com questions 18691317 querydsl how to
java.lang.ClassNotFoundException: org.jboss.logging.Logger

我有一个奇怪的问题我有一个JMS https en wiktionary org wiki JMS客户端应用程序和MDB https en wikipedia org wiki Enterprise JavaBeans Message d
Java ArrayList 和 HashMap 动态

有人可以提供一个创建Java的例子吗ArrayList and HashMap在飞行中所以而不是做一个add or put 实际上在类实例化时为数组哈希提供种子数据举个例子类似于 PHP 的例子 array array 3 1 2
JavaFX Integer Spinner (IntegerSpinnerValueFactory) 不会将值回绕到最小值

我创建了一个带有值的整数微调器 min 5 max 15 and initialValue 12 and wrapAround true 一旦旋转器到达max 15 增量期间的值而不是将值重置为min 5 正如它所说文档 https op
java mysql 准备好的语句

我正在尝试使用 java 向数据库中进行简单的插入它告诉我我的 sql 语法已关闭但是当我复制打印出来的字符串并将其放入 phpmyadmin 中的 sql 命令中时它会正确执行该命令并且我似乎无法弄清楚 java 中的字符串查询
Android - 从渲染线程内结束活动

下午好我不熟悉 android 中的活动生命周期并且一直在尽可能地阅读但我不知道如何以良好的方式解决以下问题我有一个使用 GLSurfaceView 的活动来在屏幕上绘制各种内容在这个 GLSurfaceView 的渲染线程中我
空检查时可能未初始化错误

我正在检查变量是否已初始化但此时 netbeans 给了我variable reader might not have been initialized警告我该如何解决抑制这个问题这是我的代码摘要 final Reader rea
在 servlet 会话和 java.io.NotSerializedException 中保存对象

SEVERE IOException while loading persisted sessions java io WriteAbortedException writing aborted java io NotSerializabl

随机推荐

我应该使用公共变量还是私有变量？

我第一次做一个大型项目我有很多类其中一些具有公共变量一些具有带有 setter 和 getter 方法的私有变量并且相同具有两种类型我决定重写此代码以主要仅使用一种类型但我不知道应该使用哪个仅用于同一对象中的方法的变量始终是私
Visual Studio 2005/2012：如何将第一个花括号保持在同一行？

尝试让我的 css C 函数看起来像这样 body color 222 而不是这个 body color 222 当我自动格式化代码时 C In the Tools菜单点击Options Click 显示所有参数左下角的复选框显示所有设
使用 C# 按创建日期降序获取目录中的文件列表

我想使用 C 获取按创建日期排序的文件夹中的文件列表我正在使用以下代码 if Directory Exists folderpath DirectoryInfo dir new DirectoryInfo folderpath FileI
URL 问号后面的部分是什么术语？

http www example com foo 该术语是什么foo网址的一部分这是query 或者有时请求参数从中捏取有用的图表URI RFC https datatracker ietf org doc html rfc3986 s
lua检查多个值是否相等

我喜欢用 Roblox 制作游戏并用 lua 编写代码在编写游戏时我发现自己经常问一个值是否等于另一个值这可能会产生很长的代码行并且可能非常重复例如如果 x ClassName 衬衫或x ClassName 附件或x Cl
（转）发送http请求时如何控制gzip压缩？

我想问一下大家在请求HTTP Post消息时如何控制gzip压缩 Accept Encoding gzip 作为 Http 请求标头始终添加到我发送的 http 请求中但我不想使用 gzip 压缩我该如何处理在执行http NewRe
在onPause而不是onDestroy中释放资源

这是关于后蜂窝状即Android 3 0 以及下面的引用来自https developer android com reference android app Activity html https developer android c
Rails 应用程序错误 - ActiveRecord::PendingMigrationError 迁移正在挂起；运行“rake db:migrate RAILS_ENV=development”来解决此问题

数据库已创建表已创建数据已存在但是当我重新启动Rails应用程序后我收到了这个错误该应用程序正在使用 MySQL 这里有什么问题先感谢您 Solution 只需运行 rake db migrate 在服务器启动之前需要运行一些迁
如何向java简单日期格式添加天数

如何在使用简单日期格式获得的当前日期上添加 120 天我看过一些关于它的帖子但无法让它发挥作用我的代码如下 SimpleDateFormat dateFormat new SimpleDateFormat dd MM yyyy get
使用 JavaScript 打开另一个 html 页面时传递变量

这可能是一个非常愚蠢的问题但我在网上找不到它而且我已经寻找了至少一个小时我有一个链接 a href MusicMe html Instruments a 我想在单击后获取它的 ID 因为我需要将一些变量传递到我打开的页面以知道仪器链接
2 个 2D 向量的叉积

任何人都可以提供一个返回叉积的函数的示例TWO二维向量我正在尝试实施这个算法 http www blackpawn com texts pointinpoly default html C 代码会很棒谢谢 EDIT 找到了另一种适用于
查找 NxN 网格中所有路径的算法

想象一个机器人坐在 NxN 网格的左上角机器人只能向两个方向移动向右和向下机器人有多少种可能的路径我可以在谷歌上找到这个问题的解决方案但我对解释不是很清楚我试图清楚地理解如何解决这个问题并用Java实现的逻辑任何帮助表示赞赏
Android 自定义视图应扩展 AppCompatTextView

我创建了简单的自定义视图它扩展自TextView 在 Android Studio 中我收到此警告 This custom view should extend android support v7 widget AppCompatTex
独立移动应用程序上的 WebRTC

我知道WebRTC是为浏览器设计的但是可以直接在移动应用程序上使用WebRTC库吗 Thanks 截至5月14日here https github com pchab AndroidRTC是一个android项目使用WebRTC效果很好
为什么我不能在 kotlin 中使用 lambda 接口？ [复制]

这个问题在这里已经有答案了看我有一个 Java 类 public final class JavaReceiveSingle public static void useSingle Single single single doSth
为什么仅当我在 SDL2 中设置非零 Alpha 大小时才获得 sRGB 帧缓冲区？

我正在尝试通过以下方式以伽玛正确的方式渲染典型的 OpenGL 颜色三角形本指南 https learnopengl com Advanced Lighting Gamma Correction并查阅 SDL2 文档了解如何在默认帧缓冲区
在类似热图的图中写入值，但对于seaborn中的分类变量

我在类似热图的图中绘制了一个数据框我想写入单元格但不是单元格的值但我将该值与条件进行比较并告诉它是哪种错误例如 import pandas as pd import seaborn as sns matplotlib inline
在 Android 模拟器中不使用 -writable-system 时，Hosts 文件中的更改会丢失

我通过使用标志 writable system 启动模拟器来更新 Android 模拟器中的 system etc hosts 文件 emulator exe avd tablet writable system 当我在没有 writabl
Redshift 中“ADD COLUMN IF NOT EXISTS”的解决方法

我正在尝试通过 Spark Redshift 执行 S3 复制操作并且希望在运行复制命令之前修改 Redshift 表结构以便添加任何缺失的列它们应该都是 VARCHAR 我能做的是在运行副本之前发送一个 SQL 查询所以理想情况下
inputStream 和 utf 8 有时显示“?”人物

所以我已经处理这个问题一个多月了我还通过谷歌检查了几乎所有可能的相关解决方案但我找不到任何真正解决我的情况的东西我的问题是我正在尝试从网站下载 html 源代码但在大多数情况下我得到的是某些文本显示一些其中的字符很可能是因为该网

inputStream 和 utf 8 有时显示“?”人物

inputStream 和 utf 8 有时显示“?”人物 的相关文章

随机推荐

热门标签

inputStream 和 utf 8 有时显示“?”人物的相关文章