全局参数
========

在配置完知识库之后，系统会自动分配下列全局参数给语义库，用户可以根据需求修改下列参数：


<h5>全局参数URL</h5> 


{{ '[全局参数]({}/ucenter/globalconfig)'.format(sitedomain) }}: {{ '{}/ucenter/globalconfig'.format(sitedomain) }}


<h5>参数列表</h5>


![修改密码](/_static/imgs/ucenter/kbprofile/globalparam.PNG)


<h5>1. 同义词相似度</h5>
    

在定义语义基础阶段，需要为每个语义成分分配多个同义词。这些同义词有的可能相似度，有的没有相似度，对于没有相似度的同义词，系统提供默认的相似度值，这个默认值就在这里设置：


- 生成短语的语义对象类型包括：
   <ul class="list-font14">
     <li>概念</li> 
    <li>独立节点</li>  
    <li>个体</li>  
    <li>属性</li>  
    <li>值集</li> 
    <li>单位</li>
   </ul>

- 生成句子的语义对象类型包括：
    <ul class="list-font14">
     <li>事件</li> 
     <li>事件组</li>  
   </ul>
- 相似度指标：相似度值为0~1之间的浮点数，该值越大，则对语义基础节点的表达越精确，即越接近基础节点的语义。


<h5>2. 文本生成参数：</h5>


- 生成短语文本的路径类型：
   <ul class="list-font14">
     <li>短语路径</li> 
    <li>嵌入短语路径</li>  
   </ul>

- 生成句子的路径类型：
   <ul class="list-font14">
     <li>关联路径</li> 
     <li>嵌入路径</li>  
     <li>复合路径</li> 
     <li>相似路径</li>  
   </ul>

- 在生成文本阶段，为了满足不同类型的需求，需要定量的控制文本的生成数量和质量。系统提供三个指标来保证这点：

    * 同义词个数：使用同义词个数来控制生成文本的差异程度，同义词个数越多，则生成文本使用的词汇越丰富，文本字面相似度越低，对语义场的覆盖率也就越高。在诸如聊天应用场景中，对相同语义的不同表达方式文本的捕捉概率就越高。但过多的同义词个数也会导致算法生成文本数量急剧膨胀，降低生成效率。这里系统设置默认值为3，用户可以根据自身的需求调整该值的范围，建议小于10。

    * 生成数：生成文本的总数，该数字越大，则生成文本的数量越多。这里系统设置默认值为10，用户可以根据自身的需求调整该值的范围。

    * 阈值： 这里的阈值也可以理解为困惑度，是NLP（自然语言处理）中对生成文本的流利程度的一个典型指标。这个数字越小，说明生成文本的流利程度越高，即越接近人类自然语言的表达。这里系统设置的默认值20，它是个经验值，依赖于对语言模型大规模测试。该值会根据模型的规模或算法改变进行调整。 


<h5>操作说明</h5>


```{mermaid}
%%{init:{'theme':'default', 'themeVariables':{'fontSize':'12px'}}}%%
graph LR

A[根据需求修改指定参数] --> B[点击该参数项下的保存按键] --> C[保存至数据库]
```