mark一下

相关推荐

1、文本分类特征选择算法卡方检验(Chi-Square Test):统计特征(词)与类别之间的独立性。卡方值越大,特征与类别的相关性越强。信息增益:衡量特征为分类系统带来多少信息量。信息增益值越大,特征越重要。互信息:衡量特征与类别之间的统计相关性。TF-IDF加权:通过词频(TF)和逆文档频率(IDF)筛选重要特征。高TF-IDF值的词通常为关键特征。2、ReLu替换Tanh的后果ReLu在负区间的梯度为0,可能导致神经元“死亡”​​(Dead ReLU)3、GPT的多种能力文本生成:生成符合语境和逻辑连贯的文本(学术、故事、文章)代码生成:生成可执行的代码片段(脚本、debug、功能实现)对话交互:模拟人类对话,提供个性化交互体验(客服、助手、陪伴)创意内容生成:艺术创作或设计(诗词、图案描述、营销文案)数据与知识生成:结构话信息提取或虚构数据生成(表格生成、虚构数据)多语言生成:跨语言内容生成和翻译(多语言写作)逻辑与推理生成:解决数学问题或逻辑推理任务(解题、策略)4、大模型训练和推理的参数量判断,需要多少显卡。(14B)训练:模型参数(14B)+优化器状态​(如Adam):每个参数需要存储参数、梯度、动量、二阶动量(共4份 FP32 数据)+梯度:以 FP16 存储 14B + 激活值(Activations)​:与批次大小(Batch Size)、序列长度(Sequence Length)相关,通常占用 ​20%~50% 总显存。 约为14*2+14*4*4+14*2+50=330推理:参数 + KV缓存≈28GB+1GB=29GB(FP16)或14GB(INT8)5、文本、图片、视频的标注方式文本分类、命名实体识别、关系抽取、序列标注、问答标注目标检测、图像分割、关键点识别、图像分类、OCR标注动作识别、目标跟踪、时间序列标注、多模态标注6、常见的数据清洗方式删除缺失记录、填充缺失值、标记缺失值、删除重复行、合并冲突字段、检测异常值、数据格式标准化、标签一致、逻辑一致、文本去噪、平滑技术7、简述残差连接​残差连接(Residual Connection)​ 是一种通过跳跃连接(Shortcut Connection)将输入直接传递到网络深层的技术,从而缓解深层网络的训练难题(如梯度消失、模型退化)、​加速模型训练、增强模型表达能力8、大模型训练的全过程数据准备与预处理数据收集数据清洗分词,编码加载模型迭代训练#牛客AI配图神器#
投递卓望公司等公司10个岗位
点赞 评论 收藏
分享
写在前面:当你的高考分数被钉在三本院校的那一刻起,就注定要打破对大学的传统想象。这不是失败的终点,而是需要更高明生存智慧的起点。在学历贬值的时代,清醒的认知比盲目的努力更重要。内容仅代表我个人观点,一家所言,首先,对于一个学校远不如别人,我们更需要搞清楚,这样的一个学校对于我们的定位应当是如何的?对于一个比较差的学校的我们而言,其实应当思考在学校评价体系下的你真的优秀吗,或许你拿到了国奖,是你们学院的第一名,可天下有无数的学院,你也不过是一个不出名学校中的第一名,那么,你的第一的含金量,真的会被认可吗?这其实是一个需要自我审视的过程。但是抛开大家都在说的刷实习,我想聊点不一样的,至少在我这里认为是很核心的东西——社交。不知对于大部分人是如何的,至少在我这里,我的大学应当是一个平台,给予我社交机会的一个平台,我一直相信着,即使在再差的环境,也一定会有很厉害的人。或是家境优渥而带来的高认知。又或者是技术超群,也可能是社交能力悍匪,从而结识到了很厉害的人。或许因为单一评价体系的教育,最终与我们汇聚在一个相同的地方,但这不能否认他们本身的优秀。因此在我看来,我的大学给我的最大的机遇其实是提供了一个打破信息壁垒的机会,在学校中没有特别明确的圈层隔阂,大家都有一个共同的身份就是学生。因此我们可以比在社会上更容易的和这些优秀的人成为好友。无论是从信息的获取上,又或者是其他的什么,或者说,在我大学的过程中,我唯一能确认为我最正确的选择就是向上社交以及向下兼容。对于最底层的人来说,社交其实是最好的向上跃升,拿到更多信息的最好渠道。独行者勇敢,但是众行者才能走更远。最后,祝大家都可以在一手烂牌里大将一军。#牛客激励计划# #三本# #我偏要在一手烂牌里大将一军# #腾讯暑期#
点赞 评论 收藏
分享
牛客网
牛客企业服务