网站制作无锡,台州建设工程网站,社区电商平台排行榜,网站建设 部署与发布试题文章目录 信息内容的获取网络信息内容的类型网络媒体信息获取方法 信息内容的表示视觉信息视觉特征表达文本特征表达音频特征表达 信息内容的获取
网络信息内容的类型
网络媒体信息 传统意义上的互联网网站公开发布信息#xff0c;网络用户通常可以基于网络浏览器获得。网络… 文章目录 信息内容的获取网络信息内容的类型网络媒体信息获取方法 信息内容的表示视觉信息视觉特征表达文本特征表达音频特征表达 信息内容的获取
网络信息内容的类型
网络媒体信息 传统意义上的互联网网站公开发布信息网络用户通常可以基于网络浏览器获得。网络媒体、网页信息网络通讯信息 互联网用户使用除网络浏览器以外的专用客户端软件实现与特定点通信或进行点对点通信时所交互的信息。电子邮件、网上聊天
网络媒体信息获取方法
静态媒体发布信息获取 按信息发布方式网络媒体信息可以分为直接匿名浏览信息和需身份认证网络信息 按网页具体形态可分为静态网页和动态网页两种。基于自然人网络浏览行为模拟的信息获取 自然人网络浏览行为模拟技术在网络媒体信息获取环节得到广泛应用。大模型信息获取重点好好看看 步骤如下 1用户提问可以通过提出问题开始。 2模型评估基于问题模型评估能否根据已有知识库回答否则需要使用浏览器工具。 3使用浏览器工具如需最新消息会使用内置的浏览器工具。 4回答用户将整理好的信息以回答的形式提供给用户。 5反馈和调整用户可以进行反馈模型调整搜索策略或解释信息。
信息内容的表示
视觉信息
处理过程 获取、压缩、传输、重建、处理。视觉感知器 柱状细胞、锥状细胞。 其中锥状细胞对亮度不敏感在高亮工作刺激响应快。柱状细胞反之。三原色 红、绿、蓝。计算机视觉信息 一幅图像可以用矩阵表示一个像素点对应矩阵中的一个元素。 彩色图像转化成灰度图像 Y ( R G B ) / 3 Y (RGB) / 3 Y(RGB)/3。 对于视频视频实际是其内容随时间变化的一组动态图像又叫运动图像或活动图像。
视觉特征表达
图像特征表达是理解图像内容的基础把图像从非结构化数据变成结构化数据使得其相关性可以被有效度量。
应用图像相似度计算图像检索、匹配。
颜色特征 首先选择颜色空间并将颜色空间划分成若干个小的区域即颜色量化。 统计其颜色落入每个小区间的像素数目可以得到颜色直方图。 优点 计算简单一定场景下能反映图片内容缺点丢失空间信息。如下图示例。 纹理特征 纹理是一种普遍存在的视觉现象尚无广泛接受的定义。纹理是图像灰度或色彩在空间上的变化或重复。 1局部二值模式(LBP)。 2梯度直方图特征(HOG)。 3尺度不变特征变换(SIFT)。 4后SIFT时代的其他局部特征。
文本特征表达
重点
将词语表达成向量 首先我们用 1-of-N Encoding 方法如下所示。 只有这个方法是不够的。肉眼可见的维数爆炸词语越多维数越多。因此在这一步后加入了 Word Class 和 Word Embedding 两个步骤如下。 在 Word Class 中我们对具有相同特征的词做聚类将他们分为同一个类Class用所属类来表达该词。 在 Word Embedding 中我们把每一个词都投影到高维空间上当然这个空间的维度远小于第一步 1-of-N Encoding 的维度。因此这实际上是一个降维的过程。将文本表达成向量 1词频TF词频指一个词在文本中出现的次数。通过词频进行特征选择实际上是将某一频率区间外的值去掉从而降维。 2文档频数DF指数据集中有多少文本包含某个单词。 3TF-IDF TF 某个词在文章中的出现次数 / 文章的总词数 IDF逆文档频率 log(语料库的文档总数 / (包含该词的文档数1))。 TF-IDF TF * IDF。
音频特征表达