[25’ ICLR] Notes

Date: 2024.05.18 Updated: 2024.05.18

카테고리: Hidden

📃 Reference

Hi!

[24' EMNLP] TroL: Traversal of Layers for Large Language and Vision Models 2024.10.14 | Multimodal Adapter

[24' EMNLP] MMNeuron: Discovering Neuron-Level Domain-Specific Interpretation in Multimodal Large Language Model 2024.10.14 | Multimodal Interpretability

[24' ACL] Cross-Modal Projection in Multimodal LLMs Doesn’t Really Project Visual Attributes to Textual Space 2024.10.14 | Multimodal Alignment

[24' ECCV] BLINK: Multimodal Large Language Models Can See but Not Perceive 2024.10.13 | Multimodal Benchmark Perception

[24'] Interpreting and Editing Vision-Language Representations to Mitigate Hallucinations 2024.10.11 | Multimodal Interpretability

[24'] Towards Interpreting Visual Information Processing in Vision-Language Models 2024.10.11 | Multimodal Interpretability

[24'] Quadratic Is Not What You Need For Multimodal Large Language Models 2024.10.11 | Multimodal Efficiency Pruning

[24'] Intriguing Properties of Large Language and Vision Models 2024.10.11 | Multimodal Interpretability

[24'] PSALM: Pixelwise SegmentAtion with Large Multi-Modal Model 2024.10.07 | Multimodal Unified Segmentation

[23' EMNLP Findings] Text Augmented Spatial-aware Zero-shot Referring Image Segmentation 2024.10.07 | Vision Referring Image Segmentation Training-free