面试
深度学习(公式篇)
深度学习 如何缓解过拟合?增强数据、简化模型复杂度、添加正则项、dropout、交叉验证、学习率调整 Adam原理:通过维护一阶动量(均值)和 二阶动量(方差) 来动态调整每个参数的学习率,从而加速收敛并提高稳定性。 BN和LN的区别? NMS过程 梯度消失和梯度爆炸如何缓解?梯度消失:ReLU/L
大模型面经(1)
大模型相关知识 BPE的原理? 子词分割算法,从字符级别开始,通过迭代合并频率最高的字符对(或字符序列)来构建新的 Token,从而可以处理部分 OOV(Out-Of-Vocabulary)情况。 初始化词汇表 V: V 包含语料库中的所有唯一字符,即单词字符的集合 统计字符对的频次: 对于每个单词
C++后端知识点
一些非常重要的C++基础知识点
数据库原理
数据库 事务 事务 是数据库管理系统执行过程中的一个逻辑工作单元,它由一组SQL操作组成,这些操作要么全部成功执行(提交),要么全部不执行(回滚),以确保数据库的一致性和完整性。 事务的四大特性AICD: 原子性:一个不可分割的工作单位,事务中的操作要么全部成功,要么全部失败回滚 一致性:从一个一致
计算机网络
计算机网络 常见的网络协议 网络接口层 数据帧的封装/解封装(添加/移除MAC地址) 物理寻址(MAC地址) 错误检测(如CRC校验) 数据链路控制(如以太网、PPP协议) 网络层 IP:定义数据包的格式、对数据包进行路由和寻址,以便它们可以跨网络传播并到达正确的目的地。目前 IP 协议主要分为两种