
proj — PROJ 9.6.0 documentation
2025年3月22日 · proj and invproj perform respective forward and inverse conversion of cartographic data to or from cartesian data with a wide range of selectable projection functions. invproj may not be available on all platforms; in this case use proj -I instead. The following control parameters can appear in any order.
Transformers 中 llama 网络结构解读 - 知乎 - 知乎专栏
gate_proj、up_proj 和 down_proj 是三个线性变换层,用于将输入张量 x 映射到不同的表示空间。它们分别用于产生门控信号、升维和降维操作。 act_fn 是一个激活函数,根据配置中指定的激活函数类型选择相应的激活函数。
Proj - pyproj 3.7.1 documentation - GitHub Pages
pyproj.Proj is functionally equivalent to the proj command line tool in PROJ. The PROJ docs say: projection coordinates within one datum. Bases: Transformer. Performs cartographic transformations. Converts from longitude, latitude to native map projection x,y coordinates and vice versa using PROJ (https://proj.org).
DP MLA For DeepSeek In Sglang - 知乎 - 知乎专栏
输入hidden_state的shape是(bs, seq_len, hidden_dim),经过和shape为(hidden_dim, qkv_dim/8)的qkv_proj的矩阵乘,得到(bs, seq_len, qkv_dim/8)的hidden_state,其中qkv_dim=q_dim+k_dim+v_dim。然后再经过split,reshape,transpose得到shape为(bs ,head_num/8, seq_len, head_dim)的q,k,v,其中q和kv的head_num不一定相同
根据矢量的投影长度求原矢量长度 - CSDN博客
2008年7月31日 · 矢量a的原长度为 a_len = proj_len/cos(theta) 需要首先判断proj_len是否为0;如果投影长度为0,那么夹角cos(theta)必然为90度,需直接返回无穷大就可以了。 上面的方法绕过了用acos函数求夹角的迭代开销和误差。
Functions — PROJ 9.6.0 documentation
2025年3月22日 · int proj_get_area_of_use_ex (PJ_CONTEXT * ctx, const PJ * obj, int domainIdx, double * out_west_lon_degree, double * out_south_lat_degree, double * out_east_lon_degree, double * out_north_lat_degree, const char * * out_area_name) Return the area of use of an object. Parameters: ctx-- PROJ context, or NULL for default context . obj-- Object ...
pyproj.proj - pyproj 3.7.1 documentation - GitHub Pages
Example usage: >>> from pyproj import Proj >>> p = Proj(proj='utm',zone=10,ellps='WGS84', preserve_units=False) >>> x,y = p(-120.108, 34.36116666) >>> 'x=%9.3f y=%11.3f' % (x,y) 'x=765975.641 y=3805993.134' >>> 'lon=%8.3f lat=%5.3f' % p(x,y,inverse=True) 'lon=-120.108 lat=34.361' >>> # do 3 cities at a time in a tuple (Fresno, LA, SF) >>> lons ...
Huggingface LLaMa代码解读 - 知乎 - 知乎专栏
总体来说,这个函数用于生成causal mask,确保在自注意力机制中,模型只能关注当前位置及之前的位置,以避免信息泄露和未来信息访问。 用于扩展给定的注意力mask。 mask是一个形状为 [bsz, seq_len]的张量,表示注意力mask。 dtype是一个torch.dtype对象,表示返回的扩展mask的数据类型。 tgt_len是一个可选的整数,表示目标序列长度。 如果不提供,将使用src_len的值。 bsz, src_len = mask.size ():从输入参数mask中获取batch size(bsz)和源序列长 …
RWKV高级教程:预训练、继续预训练、全量微调、词表构建 - 通 …
2024年12月18日 · model_type、n_layer、n_embd和ctx_len、proj_dir都必须和前面一致。 其他参数解读,参见 全参微调入门教程 - rwkv微调 。建议根据你的微调数据、设备性能进行调整。
查询(q_proj)、键(k_proj)和值(v_proj)投影具体含义_查询集o、键集…
2024年7月10日 · Proj是一个开源的坐标转换库,支持多种投影方式和坐标系统之间的转换。在ArcEngine中,可能需要用到Proj库来处理不同地图投影的兼容问题,确保地图数据的准确显示。 6. **开发步骤**: 开发一个包含“鹰眼”效果...
- 某些结果已被删除